亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python爬蟲(chóng)UA偽裝爬取的實(shí)例講解

 更新時(shí)間:2021年02月19日 16:31:01   作者:宋宋大人  
在本篇文章里小編給大家整理的是一篇關(guān)于Python爬蟲(chóng)UA偽裝爬取的實(shí)例講解內(nèi)容,有需要的朋友們可以學(xué)習(xí)參考下。

在使用python爬取網(wǎng)站信息時(shí),查看爬取完后的數(shù)據(jù)發(fā)現(xiàn),數(shù)據(jù)并沒(méi)有被爬取下來(lái),這是因?yàn)榫W(wǎng)站中有UA這種請(qǐng)求載體的身份標(biāo)識(shí),如果不是基于某一款瀏覽器爬取則是不正常的請(qǐng)求,所以會(huì)爬取失敗。本文介紹Python爬蟲(chóng)采用UA偽裝爬取實(shí)例。

一、python爬取失敗原因如下:

UA檢測(cè)是門(mén)戶網(wǎng)站的服務(wù)器會(huì)檢測(cè)對(duì)應(yīng)請(qǐng)求的載體身份標(biāo)識(shí),如果檢測(cè)到請(qǐng)求的載體身份標(biāo)識(shí)為某一款瀏覽器,說(shuō)明該請(qǐng)求是一個(gè)正常的請(qǐng)求。如果檢測(cè)到請(qǐng)求的載體身份標(biāo)識(shí)不是基于某一款瀏覽器的。則表示該請(qǐng)求為不正常的請(qǐng)求,則服務(wù)器端就很有可能會(huì)拒絕該次請(qǐng)求。

二、解決方法:采用UA偽裝

讓爬蟲(chóng)對(duì)應(yīng)的請(qǐng)求載體身份標(biāo)識(shí)偽裝成某一款瀏覽器,這里采用的偽裝成Chrome瀏覽器。

采用UA偽裝爬取實(shí)例

import requests
if __name__=="__main__":
  headers={
    "User-Agent":"Mozilla/5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) 
    Chrome / 88.0.4324.150 Safari / 537.36"
  }
  url="https://www.sogou.com/web"
  queryword=input("輸出關(guān)鍵字")
  param={
    "query":queryword
  }
  res=requests.get(url=url,params=param,headers=headers)
  res.encoding="utf-8"
  page_text=res.text
  fileName=queryword+".html"
  with open(fileName,"w",encoding="utf-8") as fs:
    fs.write(page_text)
  print(page_text+"爬取結(jié)束")

知識(shí)點(diǎn)擴(kuò)展:

采用UA偽裝:讓爬蟲(chóng)對(duì)應(yīng)的請(qǐng)求載體身份標(biāo)識(shí)偽裝成某一款瀏覽器,這里采用的偽裝成Chrome瀏覽器

代碼如下:

import requests
#UA:User—Agent(請(qǐng)求載體的身份標(biāo)識(shí))
# UA檢測(cè):門(mén)戶網(wǎng)站的服務(wù)器會(huì)檢測(cè)對(duì)應(yīng)請(qǐng)求的載體身份標(biāo)識(shí),如果檢測(cè)到請(qǐng)求的載體身份標(biāo)識(shí)為某一款瀏覽器,說(shuō)明該請(qǐng)求是一個(gè)正常的請(qǐng)求。
# 如果檢測(cè)到請(qǐng)求的載體身份標(biāo)識(shí)不是基于某一款瀏覽器的。則表示該請(qǐng)求為不正常的請(qǐng)求,則服務(wù)器端就很有可能會(huì)拒絕該次請(qǐng)求
if __name__=="__main__":
  headers={
    "User-Agent":"Mozilla/5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 88.0.4324.150 Safari / 537.36"
  }
  url="https://www.sogou.com/web"
  queryword=input("輸出關(guān)鍵字")
  param={
    "query":queryword
  }
  res=requests.get(url=url,params=param,headers=headers)
  res.encoding="utf-8"
  page_text=res.text
  fileName=queryword+".html"
  with open(fileName,"w",encoding="utf-8") as fs:
    fs.write(page_text)
  print(page_text+"爬取結(jié)束")

到此這篇關(guān)于Python爬蟲(chóng)UA偽裝爬取的實(shí)例講解的文章就介紹到這了,更多相關(guān)Python爬蟲(chóng)如何UA偽裝爬取內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python合并同類型excel表格的方法

    python合并同類型excel表格的方法

    這篇文章主要為大家詳細(xì)介紹了python合并同類型excel表格的方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-04-04
  • Python數(shù)據(jù)可視化常用4大繪圖庫(kù)原理詳解

    Python數(shù)據(jù)可視化常用4大繪圖庫(kù)原理詳解

    這篇文章主要介紹了Python數(shù)據(jù)可視化常用4大繪圖庫(kù)原理詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-10-10
  • Python+selenium 獲取一組元素屬性值的實(shí)例

    Python+selenium 獲取一組元素屬性值的實(shí)例

    今天小編就為大家分享一篇Python+selenium 獲取一組元素屬性值的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-06-06
  • 基于Pandas讀取csv文件Error的總結(jié)

    基于Pandas讀取csv文件Error的總結(jié)

    今天小編就為大家分享一篇基于Pandas讀取csv文件Error的總結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-06-06
  • PyCharm安裝庫(kù)numpy失敗問(wèn)題的詳細(xì)解決方法

    PyCharm安裝庫(kù)numpy失敗問(wèn)題的詳細(xì)解決方法

    今天使用pycharm編譯python程序時(shí),由于要調(diào)用numpy包,但又未曾安裝numpy,于是就根據(jù)pycharm的提示進(jìn)行安裝,最后竟然提示出錯(cuò),下面這篇文章主要給大家介紹了關(guān)于PyCharm安裝庫(kù)numpy失敗問(wèn)題的詳細(xì)解決方法,需要的朋友可以參考下
    2022-06-06
  • matlab、python中矩陣的互相導(dǎo)入導(dǎo)出方式

    matlab、python中矩陣的互相導(dǎo)入導(dǎo)出方式

    這篇文章主要介紹了matlab、python中矩陣的互相導(dǎo)入導(dǎo)出方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-06-06
  • TensorFlow 模型載入方法匯總(小結(jié))

    TensorFlow 模型載入方法匯總(小結(jié))

    這篇文章主要介紹了TensorFlow 模型載入方法匯總(小結(jié)),小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧
    2018-06-06
  • Python爬取視頻(其實(shí)是一篇福利)過(guò)程解析

    Python爬取視頻(其實(shí)是一篇福利)過(guò)程解析

    這篇文章主要介紹了Python爬取視頻(其實(shí)是一篇福利)過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-08-08
  • 一文詳解Python中實(shí)現(xiàn)單例模式的幾種常見(jiàn)方式

    一文詳解Python中實(shí)現(xiàn)單例模式的幾種常見(jiàn)方式

    這篇文章主要為大家介紹了Python中實(shí)現(xiàn)單例模式的幾種常見(jiàn)方式示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-03-03
  • Python classmethod裝飾器原理及用法解析

    Python classmethod裝飾器原理及用法解析

    這篇文章主要介紹了Python classmethod裝飾器原理及用法解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-10-10

最新評(píng)論