亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python爬蟲(chóng)實(shí)現(xiàn)驗(yàn)證碼登錄代碼實(shí)例

 更新時(shí)間:2019年05月10日 11:09:40   作者:小迷妹大米姐  
這篇文章主要介紹了Python爬蟲(chóng)實(shí)現(xiàn)驗(yàn)證碼登錄,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧

很多網(wǎng)站為了避免被惡意訪(fǎng)問(wèn),需要設(shè)置驗(yàn)證碼登錄,避免非人類(lèi)的訪(fǎng)問(wèn),Python爬蟲(chóng)實(shí)現(xiàn)驗(yàn)證碼登錄的原理則是先到登錄頁(yè)面將生成的驗(yàn)證碼保存下來(lái),然后人為輸入后,包裝后再POST給服務(wù)器,實(shí)現(xiàn)驗(yàn)證,這里還涉及到了Cookie,其實(shí)Cookie保存在本地主機(jī)上,避免用戶(hù)重復(fù)輸入用戶(hù)名和密碼,在連接服務(wù)器的時(shí)候?qū)⒃L(fǎng)問(wèn)連接和Cookie組裝起來(lái)POST給服務(wù)器。

這里涉及到了兩次向服務(wù)器POST,一次是Cookie,這里還自行設(shè)計(jì)想要Cookie的內(nèi)容,由于是要登錄,Cookie中存放的則是用戶(hù)名和密碼。第二次POST則是向服務(wù)器提交驗(yàn)證。

這里用到Python3,主要用到的包是re  urllib.request   http.cookiejar

上代碼,借鑒了別人的代碼~~~

import re
import urllib.request
import http.cookiejar
#from http.comkie import CookieJar 上面那句和這句等同
 
loginurl='https://www.douban.com/accounts/login'
cookie = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor)#在已存的Cookie下建立連接
 
params={}
params['form_email']='用戶(hù)名'
params['form_password']='密碼'#這里寫(xiě)上已有的用戶(hù)名和密碼
params['source']='http://www.douban.com/accounts/login'
 
#從首頁(yè)提交登陸
response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))#urllib.parse.urlencode(params).encode('utf-8')這個(gè)是向服務(wù)
#器POST的內(nèi)容,可以打印一下response.geturl()請(qǐng)求的連接看一下
#print(response.geturl()[0:33])
#驗(yàn)證成功跳轉(zhuǎn)至登陸頁(yè)
if response.geturl()[0:33]=='https://accounts.douban.com/login':
    html = response.read().decode('utf-8')
    #print(html),可以先打印一下文件內(nèi)容,為了看到網(wǎng)頁(yè)元素更方便的寫(xiě)正則,可以復(fù)制下來(lái),在需要獲取的地方用(.+?)表示,然后用group()元組來(lái)取得,
    #驗(yàn)證圖片地址
    imgurl=re.search('<img id="captcha_image" src="(.+?)" alt="captcha" class="captcha_image"/>',html)
    if imgurl:
       url=imgurl.group(1)
       #print(url)
       #將驗(yàn)證碼以v.jpg保存在本地,在輸入驗(yàn)證碼的時(shí)候可以手工輸入
       res=urllib.request.urlretrieve(url,'v.jpg')
       captcha = re.search('<input type="hidden" name="captcha-id" value="(.+?)"/>',html)
       #print(captcha.group(1))
       if captcha:
           vcode=input('請(qǐng)輸入圖片上的驗(yàn)證碼:')
           params["captcha-solution"] = vcode
           params["captcha-id"] = captcha.group(1)#這個(gè)是動(dòng)態(tài)生成的,需要從網(wǎng)頁(yè)中獲得
           params["user_login"] = "登錄"
           #提交驗(yàn)證碼驗(yàn)證
           response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))
           if response.geturl()=="https://www.douban.com/":
              print("login sucess")

以上所述是小編給大家介紹的Python爬蟲(chóng)實(shí)現(xiàn)驗(yàn)證碼登錄詳解整合,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!

相關(guān)文章

  • Python基于鏈接表實(shí)現(xiàn)無(wú)向圖最短路徑搜索

    Python基于鏈接表實(shí)現(xiàn)無(wú)向圖最短路徑搜索

    鏈接表的存儲(chǔ)相比較鄰接炬陣,使用起來(lái)更方便,對(duì)于空間的使用是剛好夠用原則,不會(huì)產(chǎn)生太多空間浪費(fèi)。所以本文將以鏈接表方式實(shí)現(xiàn)無(wú)向圖最短路徑搜索,需要的可以參考一下
    2022-04-04
  • Python HTMLTestRunner可視化報(bào)告實(shí)現(xiàn)過(guò)程解析

    Python HTMLTestRunner可視化報(bào)告實(shí)現(xiàn)過(guò)程解析

    這篇文章主要介紹了Python HTMLTestRunner可視化報(bào)告實(shí)現(xiàn)過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-04-04
  • 用Python復(fù)現(xiàn)二戰(zhàn)德軍enigma密碼機(jī)

    用Python復(fù)現(xiàn)二戰(zhàn)德軍enigma密碼機(jī)

    大家好,本篇文章主要講的是用Python復(fù)現(xiàn)二戰(zhàn)德軍enigma密碼機(jī),感興趣的同學(xué)趕快來(lái)看一看吧,對(duì)你有幫助的話(huà)記得收藏一下,方便下次瀏覽
    2022-01-01
  • 如何用 Python 處理不平衡數(shù)據(jù)集

    如何用 Python 處理不平衡數(shù)據(jù)集

    這篇文章主要介紹了如何用 Python 處理不平衡數(shù)據(jù)集,幫助大家更好的利用python進(jìn)行數(shù)據(jù)分析,感興趣的朋友可以了解下
    2021-01-01
  • 基于Python的自媒體小助手---登錄頁(yè)面的實(shí)現(xiàn)代碼

    基于Python的自媒體小助手---登錄頁(yè)面的實(shí)現(xiàn)代碼

    這篇文章主要介紹了基于Python的自媒體小助手---登錄頁(yè)面的實(shí)現(xiàn)代碼,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-06-06
  • python下載文件的兩種方式

    python下載文件的兩種方式

    這篇文章主要介紹了python下載文件的兩種方式:接口方式和Nginx這兩種方式,并通過(guò)代碼示例講解的非常詳細(xì),對(duì)大家學(xué)習(xí)python下載文件有一定的幫助,需要的朋友可以參考下
    2024-08-08
  • python爬取拉勾網(wǎng)職位數(shù)據(jù)的方法

    python爬取拉勾網(wǎng)職位數(shù)據(jù)的方法

    這篇文章主要介紹了python爬取拉勾網(wǎng)職位數(shù)據(jù)的實(shí)現(xiàn)方法,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下
    2018-01-01
  • python爬取股票最新數(shù)據(jù)并用excel繪制樹(shù)狀圖的示例

    python爬取股票最新數(shù)據(jù)并用excel繪制樹(shù)狀圖的示例

    這篇文章主要介紹了python爬取股票最新數(shù)據(jù)并用excel繪制樹(shù)狀圖的示例,幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下
    2021-03-03
  • 在pycharm中關(guān)掉ipython console/PyDev操作

    在pycharm中關(guān)掉ipython console/PyDev操作

    這篇文章主要介紹了在pycharm中關(guān)掉ipython console/PyDev操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-06-06
  • Django模板標(biāo)簽中url使用詳解(url跳轉(zhuǎn)到指定頁(yè)面)

    Django模板標(biāo)簽中url使用詳解(url跳轉(zhuǎn)到指定頁(yè)面)

    這篇文章主要介紹了Django模板標(biāo)簽中url使用詳解(url跳轉(zhuǎn)到指定頁(yè)面),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-03-03

最新評(píng)論