久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > 使用python測試網(wǎng)頁中超鏈接的連通性

使用python測試網(wǎng)頁中超鏈接的連通性

來源:千鋒教育
發(fā)布人:xqq
時(shí)間: 2023-11-06 22:08:43 1699279723

在web測試,對網(wǎng)頁中的超鏈接進(jìn)行測試是最基本的工作,最簡便的方法當(dāng)然是使用像xenu之類的工具。但它具體是怎么實(shí)現(xiàn)的呢?我想也無外乎是通過http協(xié)議,根據(jù)超鏈接地址,向服務(wù)端發(fā)送請求,然后根據(jù)返回的信息進(jìn)行判斷連接的狀態(tài)。下面是根據(jù)這種思路,用python編寫的檢測網(wǎng)頁鏈接連通性的程序。

首先,建立一個(gè)示例網(wǎng)頁,其中l(wèi)ink1,lin3是不連通的,link2,link4是有效鏈接

Test

http://http://m.2667701.com/">link1>
link2
link3
http://www.e70w.com/">link4>

使用python進(jìn)行鏈接檢測,要使用到4個(gè)重要模塊,過程就是通過urllib抓取目標(biāo)網(wǎng)頁的html代碼,然后通過sgmllib模塊解析html,獲取超鏈接的列表。然后使用urlparse解析超鏈接的url,供httplib使用。然后由httplib模塊進(jìn)行最后的請求及驗(yàn)證回復(fù)的過程。

sgmllib:用于HTML解析,解析出網(wǎng)頁中包含的超鏈接

httplib:用于Http協(xié)議的操作

urllib:用于獲取網(wǎng)頁的html代碼

urlparse:解析url地址,把url地址解析成幾個(gè)部分。

具體實(shí)現(xiàn)代碼如下:

#-×-coding:gb2312-*-

importhttplib,urllib,urlparse

fromsgmllibimportSGMLParser

#解析指定的網(wǎng)頁的html,得到該頁面的超鏈接列表

classURLLister(SGMLParser):

defreset(self):

SGMLParser.reset(self)

self.urls=[]

defstart_a(self,attrs):

href=[vfork,vinattrsifk=='href']

ifhref:

self.urls.extend(href)

#遍歷超鏈接列表,并逐個(gè)的發(fā)送請求,判斷接收后的代碼,200為正常,其他為不正常

deffetch(host):

usock=urllib.urlopen(host)

parser=URLLister()

parser.feed(usock.read())

uhost=urlparse.urlparse(host)

forurlinparser.urls:

up=urlparse.urlparse(url)

#因?yàn)槌溄佑袃煞N方式:一種是直接的http://......一種是相對路徑,/.../sample.html

#所以要分別處理

ifup.netloc=="":

http=httplib.HTTP(uhost.netloc)

http.putrequest("GET","/"+up.path+"?"+up.params+up.query+up.fragment)

http.putheader("Accept","*/*")

http.endheaders()

else:

http=httplib.HTTP(up.netloc)

http.putrequest("GET",up.path+"?"+up.params+up.query+up.fragment)

http.putheader("Accept","*/*")

http.endheaders()

errcode,errmsg,headers=http.getreply()

iferrcode==200:

printurl,":ok"

else:

printurl,":",errcode

#測試

fetch("http://m.2667701.com/")

代碼運(yùn)行的結(jié)果:

http://m.2667701.com/erwerwe.html:404

/sample/lik.html:ok

/sample/lik2.html:404

http://m.2667701.com/:ok

以上內(nèi)容為大家介紹了使用python測試網(wǎng)頁中超鏈接的連通性,希望對大家有所幫助,如果想要了解更多Python相關(guān)知識,請關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。http://m.2667701.com/

聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT