亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python反爬蟲偽裝瀏覽器進行爬蟲

 更新時間:2020年02月28日 13:25:32   作者:Tynam.Yang  
這篇文章主要介紹了Python反爬蟲偽裝瀏覽器進行爬蟲,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

對于爬蟲中部分網站設置了請求次數過多后會封殺ip,現在模擬瀏覽器進行爬蟲,也就是說讓服務器認識到訪問他的是真正的瀏覽器而不是機器操作

簡單的直接添加請求頭,將瀏覽器的信息在請求數據時傳入:

打開瀏覽器--打開開發(fā)者模式--請求任意網站

如下圖:找到請求的的名字,打開后查看headers欄,找到User-Agent,復制。然后添加到請求頭中

代碼如下:

import requests
url = 'https://www.baidu.com'
headers ={
    'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) '
           'Chrome/65.0.3325.181 Safari/537.36'
    }
rq = requests.get(url=url, headers=headers)
print(rq.text)

更深的偽裝瀏覽器,添加多個瀏覽器信息,每次請求的時候隨機發(fā)送瀏覽器信息,讓服務器了解不是一個瀏覽器一直在訪問,(可以百度查找user-agent)

代碼如下:

import requests
import random

url = 'https://www.baidu.com'
headers_lists =(
    'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) '
           'Chrome/65.0.3325.181 Safari/537.36',
    'Mozilla/4.0(compatible;MSIE7.0;WindowsNT5.1;Maxthon2.0',
    'Opera/9.80(Android2.3.4;Linux;Operamobi/adr-1107051709;U;zh-cn)Presto/2.8.149Version/11.10',
    'Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1',
    'Mozilla/5.0(Android;Linuxarmv7l;rv:5.0)Gecko/Firefox/5.0fennec/5.0',)

rq = requests.get(url=url,headers={'User-Agent':random.choice(headers_lists)})
print(rq.text)

完整的請求體解釋:

以下是筆者訪問百度的請求體。

Accept:瀏覽器端可以接受的媒體類型

Accept-Encoding:瀏覽器申明自己接收的編碼方法

Accept-Language:瀏覽器申明自己接收的語言

Connection:keep-alive 客戶端和服務器之間還在連接中,如果關閉就是close

Host:請求報頭域主要用于指定被請求資源的Internet主機和端口號

User-Agent:使用的操作系統(tǒng)和瀏覽器的名稱和版本

Cookie:是用來存儲一些用戶信息以便讓服務器辨別用戶身份的

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關文章

  • python中的import絕對導入與相對導入詳解

    python中的import絕對導入與相對導入詳解

    這篇文章主要介紹了python中的import絕對導入與相對導入詳解,在使用python做一些簡單項目時,import一般不會出現問題,但項目結構復雜時,import可能發(fā)生報錯,需要的朋友可以參考下
    2023-11-11
  • Python中optparser庫用法實例詳解

    Python中optparser庫用法實例詳解

    這篇文章主要介紹了Python中optparser庫用法實例詳解,介紹了optparser的引入,初始化等相關內容,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下
    2018-01-01
  • 使用GitHub和Python實現持續(xù)部署的方法

    使用GitHub和Python實現持續(xù)部署的方法

    這篇文章主要介紹了使用GitHub和Python實現持續(xù)部署的方法,小編覺得挺不錯的,現在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2019-05-05
  • Celery批量異步調用任務一直等待結果問題

    Celery批量異步調用任務一直等待結果問題

    這篇文章主要介紹了Celery批量異步調用任務一直等待結果問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2023-11-11
  • python編程實現清理微信重復緩存文件

    python編程實現清理微信重復緩存文件

    這篇文章主要為大家介紹了使用python編程來實現清理微信重復緩存文件的示例代碼過程,有需要的朋友可以借鑒參考下,希望能夠有所幫助
    2021-11-11
  • pandas去重復行并分類匯總的實現方法

    pandas去重復行并分類匯總的實現方法

    這篇文章主要介紹了pandas去重復行并分類匯總的實現方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-01-01
  • Python實現監(jiān)控遠程主機實時數據的示例詳解

    Python實現監(jiān)控遠程主機實時數據的示例詳解

    這篇文章主要為大家詳細介紹了Python如何使用Socket庫和相應的第三方庫來監(jiān)控遠程主機的實時數據,比如CPU使用率、內存使用率、網絡帶寬等,感興趣的可以了解一下
    2023-04-04
  • 跟老齊學Python之使用Python操作數據庫(1)

    跟老齊學Python之使用Python操作數據庫(1)

    本文詳細講述了使用python操作數據庫所需要了解的知識以及準備工作,十分的詳盡,這里推薦給想學習python的小伙伴。
    2014-11-11
  • 深度學習入門之Pytorch 數據增強的實現

    深度學習入門之Pytorch 數據增強的實現

    這篇文章主要介紹了深度學習入門之Pytorch 數據增強的實現,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-02-02
  • Pytorch如何加載自己的數據集(使用DataLoader讀取Dataset)

    Pytorch如何加載自己的數據集(使用DataLoader讀取Dataset)

    這篇文章主要介紹了Pytorch如何加載自己的數據集(使用DataLoader讀取Dataset)問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-12-12

最新評論