亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python檢測網(wǎng)站鏈接是否已存在

 更新時間:2016年04月07日 09:31:17   作者:jerrylsxu  
Python是一種解釋型、面向?qū)ο?、動態(tài)數(shù)據(jù)類型的高級程序設(shè)計語言。通過本文給大家介紹Python檢測網(wǎng)站鏈接是否已存在的相關(guān)內(nèi)容,需要的朋友一起學(xué)習(xí)吧

Python是一種解釋型、面向?qū)ο?、動態(tài)數(shù)據(jù)類型的高級程序設(shè)計語言。

Python由Guido van Rossum于1989年底發(fā)明,第一個公開發(fā)行版發(fā)行于1991年。

像Perl語言一樣, Python 源代碼同樣遵循 GPL(GNU General Public License)協(xié)議。

早就聽說Python語言操作簡單,果然名不虛傳,短短幾句,就實現(xiàn)了基本的功能。

要檢測目標(biāo)網(wǎng)站上是否存在指定的URL,其實過程很簡單:

1、獲得指定網(wǎng)站網(wǎng)頁的HTML代碼

2、在HTML代碼中查找指定的URL

3、如果存在,OK;否則,Error

整個程序引用了兩個lib庫,urllib2和sgmllib。

urllib2庫主要定義了一些訪問URL(基本通過HTTP)的函數(shù)與類。

sgmllib庫主要負(fù)責(zé)解析HTML代碼。

import urllib
from sgmllib import SGMLParser
class URLLister(SGMLParser):
def reset(self):
SGMLParser.reset(self)
self.urls = []
def start_a(self,attrs):
href=[v for k,v in attrs if k=='href']
if href:
if (href[].count('http://網(wǎng)站URL')==):
self.urls.extend(href)
links = ['http://www.google.com/',
'http://www.baidu.com',
'http://www.sohu.net',
'http://www..com',
'http://www.cnblogs.com',
'http://www.qq.com',
'http://www.yahoo.com/',
'http://www.bing.com/',
'http://www..com',]
for eachlink in links:
f = urllib.urlopen(eachlink)
if f.code ==:
parser = URLLister()
parser.feed(f.read())
f.close()
if (len(parser.urls)>=):
print 'The link from '+eachlink+' is OK!'
else:
print 'The link from '+eachlink+' is ERROR!'

這其中幾個主要函數(shù):

1、urllib2.urlopen(url[, data][, timeout])//打開一個URL

2、SGMLParser.feed(data) //獲得需要解析的HTML數(shù)據(jù)

3、SGMLParser.start_tag(attributes) //指定需要解析的HTML標(biāo)簽,在本程序中,我們調(diào)用了start_a,說明我們需要解析HTML代碼中<a>標(biāo)簽。通過查找<a>標(biāo)簽中href屬性的value,可以獲得該網(wǎng)頁上所有鏈接的信息,只要我們指定的URL存在,就OK了。

這其實是一個很小的腳本,但也讓我激動不已。一來,我已經(jīng)跨進(jìn)了Python的世界,并用它解決了實際工作中的問題,二來,它的簡單語法、縮進(jìn)格式著實讓我眼前一亮。今后,希望能夠多多使用Python,解決實際工作中的種種問題,做到學(xué)以致用.

以上內(nèi)容是針對Python檢測網(wǎng)站鏈接是否已存在的相關(guān)介紹,希望對大家有所幫助!

相關(guān)文章

  • python利用pytesseract 實現(xiàn)本地識別圖片文字

    python利用pytesseract 實現(xiàn)本地識別圖片文字

    這篇文章主要介紹了python利用pytesseract 實現(xiàn)本地識別圖片文字,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2020-12-12
  • Python自動化測試之登錄腳本的實現(xiàn)

    Python自動化測試之登錄腳本的實現(xiàn)

    本文主要介紹了Python自動化測試之登錄腳本的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-02-02
  • 使用python繪制cdf的多種實現(xiàn)方法

    使用python繪制cdf的多種實現(xiàn)方法

    今天小編就為大家分享一篇使用python繪制cdf的多種實現(xiàn)方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-02-02
  • Django ORM多對多查詢方法(自定義第三張表&ManyToManyField)

    Django ORM多對多查詢方法(自定義第三張表&ManyToManyField)

    今天小編就為大家分享一篇Django ORM多對多查詢方法(自定義第三張表&ManyToManyField),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-08-08
  • Python正則抓取網(wǎng)易新聞的方法示例

    Python正則抓取網(wǎng)易新聞的方法示例

    這篇文章主要介紹了Python正則抓取網(wǎng)易新聞的方法,結(jié)合實例形式較為詳細(xì)的分析了Python使用正則進(jìn)行網(wǎng)易新聞抓取操作的相關(guān)實現(xiàn)技巧與注意事項,需要的朋友可以參考下
    2017-04-04
  • python下對hsv顏色空間進(jìn)行量化操作

    python下對hsv顏色空間進(jìn)行量化操作

    這篇文章主要介紹了python下對hsv顏色空間進(jìn)行量化操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • python對象及面向?qū)ο蠹夹g(shù)詳解

    python對象及面向?qū)ο蠹夹g(shù)詳解

    這篇文章主要介紹了python對象及面向?qū)ο蠹夹g(shù),結(jié)合實例形式詳細(xì)分析了Python面向?qū)ο笏婕暗念悺ο?、方法、屬性等概念與使用技巧,需要的朋友可以參考下
    2016-07-07
  • PyQt5基本控件使用詳解:單選按鈕、復(fù)選框、下拉框

    PyQt5基本控件使用詳解:單選按鈕、復(fù)選框、下拉框

    這篇文章主要介紹了PyQt5基本控件使用:單選按鈕、復(fù)選框、下拉框,本文中的內(nèi)容和實例也基本回答了開篇提到的問題。需要的朋友可以參考下
    2019-08-08
  • python操作excel文件并輸出txt文件的實例

    python操作excel文件并輸出txt文件的實例

    今天小編就為大家分享一篇python操作excel文件并輸出txt文件的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-07-07
  • 基于python做一個2048小游戲

    基于python做一個2048小游戲

    2048的邏輯無非是操作4*4的方格,每個方格中有一個數(shù),這些數(shù)可以移動,如果兩個相同的數(shù)字在移動時相撞了,就可以彼此合并,本文將給大家介紹如何基于python做一個2048小游戲,感興趣的小伙伴跟著小編一起來看看吧
    2024-01-01

最新評論