Python爬蟲(chóng)實(shí)現(xiàn)驗(yàn)證碼登錄代碼實(shí)例
很多網(wǎng)站為了避免被惡意訪(fǎng)問(wèn),需要設(shè)置驗(yàn)證碼登錄,避免非人類(lèi)的訪(fǎng)問(wèn),Python爬蟲(chóng)實(shí)現(xiàn)驗(yàn)證碼登錄的原理則是先到登錄頁(yè)面將生成的驗(yàn)證碼保存下來(lái),然后人為輸入后,包裝后再POST給服務(wù)器,實(shí)現(xiàn)驗(yàn)證,這里還涉及到了Cookie,其實(shí)Cookie保存在本地主機(jī)上,避免用戶(hù)重復(fù)輸入用戶(hù)名和密碼,在連接服務(wù)器的時(shí)候?qū)⒃L(fǎng)問(wèn)連接和Cookie組裝起來(lái)POST給服務(wù)器。
這里涉及到了兩次向服務(wù)器POST,一次是Cookie,這里還自行設(shè)計(jì)想要Cookie的內(nèi)容,由于是要登錄,Cookie中存放的則是用戶(hù)名和密碼。第二次POST則是向服務(wù)器提交驗(yàn)證。
這里用到Python3,主要用到的包是re urllib.request http.cookiejar
上代碼,借鑒了別人的代碼~~~
import re import urllib.request import http.cookiejar #from http.comkie import CookieJar 上面那句和這句等同 loginurl='https://www.douban.com/accounts/login' cookie = http.cookiejar.CookieJar() opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor)#在已存的Cookie下建立連接 params={} params['form_email']='用戶(hù)名' params['form_password']='密碼'#這里寫(xiě)上已有的用戶(hù)名和密碼 params['source']='http://www.douban.com/accounts/login' #從首頁(yè)提交登陸 response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))#urllib.parse.urlencode(params).encode('utf-8')這個(gè)是向服務(wù) #器POST的內(nèi)容,可以打印一下response.geturl()請(qǐng)求的連接看一下 #print(response.geturl()[0:33]) #驗(yàn)證成功跳轉(zhuǎn)至登陸頁(yè) if response.geturl()[0:33]=='https://accounts.douban.com/login': html = response.read().decode('utf-8') #print(html),可以先打印一下文件內(nèi)容,為了看到網(wǎng)頁(yè)元素更方便的寫(xiě)正則,可以復(fù)制下來(lái),在需要獲取的地方用(.+?)表示,然后用group()元組來(lái)取得, #驗(yàn)證圖片地址 imgurl=re.search('<img id="captcha_image" src="(.+?)" alt="captcha" class="captcha_image"/>',html) if imgurl: url=imgurl.group(1) #print(url) #將驗(yàn)證碼以v.jpg保存在本地,在輸入驗(yàn)證碼的時(shí)候可以手工輸入 res=urllib.request.urlretrieve(url,'v.jpg') captcha = re.search('<input type="hidden" name="captcha-id" value="(.+?)"/>',html) #print(captcha.group(1)) if captcha: vcode=input('請(qǐng)輸入圖片上的驗(yàn)證碼:') params["captcha-solution"] = vcode params["captcha-id"] = captcha.group(1)#這個(gè)是動(dòng)態(tài)生成的,需要從網(wǎng)頁(yè)中獲得 params["user_login"] = "登錄" #提交驗(yàn)證碼驗(yàn)證 response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8')) if response.geturl()=="https://www.douban.com/": print("login sucess")
以上所述是小編給大家介紹的Python爬蟲(chóng)實(shí)現(xiàn)驗(yàn)證碼登錄詳解整合,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
- 用Python爬蟲(chóng)破解滑動(dòng)驗(yàn)證碼的案例解析
- python網(wǎng)絡(luò)爬蟲(chóng)實(shí)現(xiàn)發(fā)送短信驗(yàn)證碼的方法
- Python爬蟲(chóng)爬取ts碎片視頻+驗(yàn)證碼登錄功能
- python爬蟲(chóng)如何解決圖片驗(yàn)證碼
- Python爬蟲(chóng)模擬登陸嗶哩嗶哩(bilibili)并突破點(diǎn)選驗(yàn)證碼功能
- Python3爬蟲(chóng)里關(guān)于識(shí)別微博宮格驗(yàn)證碼的知識(shí)點(diǎn)詳解
- Python3爬蟲(chóng)關(guān)于識(shí)別點(diǎn)觸點(diǎn)選驗(yàn)證碼的實(shí)例講解
- Python3爬蟲(chóng)關(guān)于識(shí)別檢驗(yàn)滑動(dòng)驗(yàn)證碼的實(shí)例
- Python3爬蟲(chóng)中識(shí)別圖形驗(yàn)證碼的實(shí)例講解
- Python3網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)實(shí)戰(zhàn)之極驗(yàn)滑動(dòng)驗(yàn)證碼的識(shí)別
- python爬蟲(chóng)解決驗(yàn)證碼的思路及示例
- python爬蟲(chóng)之驗(yàn)證碼篇3-滑動(dòng)驗(yàn)證碼識(shí)別技術(shù)
- python爬蟲(chóng)之自動(dòng)登錄與驗(yàn)證碼識(shí)別
- Python爬蟲(chóng)爬驗(yàn)證碼實(shí)現(xiàn)功能詳解
- Python爬蟲(chóng)模擬登錄帶驗(yàn)證碼網(wǎng)站
- 爬蟲(chóng)Python驗(yàn)證碼識(shí)別入門(mén)
相關(guān)文章
Python基于鏈接表實(shí)現(xiàn)無(wú)向圖最短路徑搜索
鏈接表的存儲(chǔ)相比較鄰接炬陣,使用起來(lái)更方便,對(duì)于空間的使用是剛好夠用原則,不會(huì)產(chǎn)生太多空間浪費(fèi)。所以本文將以鏈接表方式實(shí)現(xiàn)無(wú)向圖最短路徑搜索,需要的可以參考一下2022-04-04Python HTMLTestRunner可視化報(bào)告實(shí)現(xiàn)過(guò)程解析
這篇文章主要介紹了Python HTMLTestRunner可視化報(bào)告實(shí)現(xiàn)過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-04-04用Python復(fù)現(xiàn)二戰(zhàn)德軍enigma密碼機(jī)
大家好,本篇文章主要講的是用Python復(fù)現(xiàn)二戰(zhàn)德軍enigma密碼機(jī),感興趣的同學(xué)趕快來(lái)看一看吧,對(duì)你有幫助的話(huà)記得收藏一下,方便下次瀏覽2022-01-01基于Python的自媒體小助手---登錄頁(yè)面的實(shí)現(xiàn)代碼
這篇文章主要介紹了基于Python的自媒體小助手---登錄頁(yè)面的實(shí)現(xiàn)代碼,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-06-06python爬取拉勾網(wǎng)職位數(shù)據(jù)的方法
這篇文章主要介紹了python爬取拉勾網(wǎng)職位數(shù)據(jù)的實(shí)現(xiàn)方法,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下2018-01-01python爬取股票最新數(shù)據(jù)并用excel繪制樹(shù)狀圖的示例
這篇文章主要介紹了python爬取股票最新數(shù)據(jù)并用excel繪制樹(shù)狀圖的示例,幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下2021-03-03在pycharm中關(guān)掉ipython console/PyDev操作
這篇文章主要介紹了在pycharm中關(guān)掉ipython console/PyDev操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-06-06Django模板標(biāo)簽中url使用詳解(url跳轉(zhuǎn)到指定頁(yè)面)
這篇文章主要介紹了Django模板標(biāo)簽中url使用詳解(url跳轉(zhuǎn)到指定頁(yè)面),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-03-03