亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

快速一鍵生成Python爬蟲請(qǐng)求頭

 更新時(shí)間:2021年03月04日 16:04:57   作者:zhangdingqu  
這篇文章主要介紹了如何快速一鍵生成Python爬蟲請(qǐng)求頭,幫助大家更好的理解和學(xué)習(xí)使用python爬蟲,感興趣的朋友可以了解下

今天介紹個(gè)神奇的網(wǎng)站!堪稱爬蟲偷懶的神器!

我們?cè)趯懪老x,構(gòu)建網(wǎng)絡(luò)請(qǐng)求的時(shí)候,不可避免地要添加請(qǐng)求頭( headers ),以 mdn 學(xué)習(xí)區(qū)為例,我們的請(qǐng)求頭是這樣的:

一般來(lái)說(shuō),我們只要添加 user-agent 就能滿足絕大部分需求了,Python 代碼如下:

import requests

headers = {
 #'authority': 'developer.mozilla.org',
 #'pragma': 'no-cache',
 #'cache-control': 'no-cache',
 #'upgrade-insecure-requests': '1',
 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',
 #'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
 #'accept-encoding': 'gzip, deflate, br',
 #'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',
 #'cookie': 你的cookie,
}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些請(qǐng)求,我們要把特定的 headers 參數(shù)添加上才能獲得正確的網(wǎng)絡(luò)響應(yīng),不知道哪個(gè)參數(shù)是必要的情況下,就要先把所有參數(shù)都添加上,再逐個(gè)排除。

但是手動(dòng)復(fù)制粘貼 headers 字典里的每一個(gè)鍵值對(duì)太費(fèi)事了

一個(gè)不那么方便的解決方案:

用正則表達(dá)式或者直接字符串替換,把 headers 字符串直接轉(zhuǎn)化為字典,封裝成函數(shù)方便以后反復(fù)調(diào)用。

有的人喜歡用這種方法,每次復(fù)制headers信息,然后調(diào)用自己封裝好的函數(shù),但我覺(jué)得還是挺麻煩的。

那么還有沒(méi)有快速一鍵生成 Python 爬蟲請(qǐng)求頭的方法呢?
這里給大家介紹兩個(gè):

  • 網(wǎng)站在線轉(zhuǎn)換
  • Postman

實(shí)戰(zhàn)演練

抓取網(wǎng)站:https://developer.mozilla.org...

網(wǎng)站在線轉(zhuǎn)換

1,Chrome 打開開發(fā)者選項(xiàng)( f12 )---> network 選項(xiàng)卡 ---> 刷新頁(yè)面,獲取請(qǐng)求 ---> 找到頁(yè)面信息對(duì)應(yīng)的請(qǐng)求 (通過(guò)請(qǐng)求的名稱、后綴和 response 內(nèi)容來(lái)判斷)

2,右鍵,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

3,打開網(wǎng)站,https://curl.trillworks.com/,粘貼 cURL (bash) 到左邊 curl command,右邊會(huì)自動(dòng)出 Python 代碼

4,生成代碼如下圖

5,print ( response.text ) 就可以直接打印網(wǎng)頁(yè)源代碼啦!

Postman

1,下載 postman ( Chrome 也有個(gè) postman 的插件,操作應(yīng)該差不多)

2,打開 postman,彈出的界面可以直接關(guān)掉

3,import --> paste raw text,在 Chrome 里復(fù)制 curl (bash),粘貼到下面的對(duì)話框里,點(diǎn)擊 import 按鈕

4,點(diǎn)擊 send,模擬網(wǎng)絡(luò)請(qǐng)求,下方可查看源代碼

5,確保源代碼正常后,點(diǎn)擊 code

6,左上角可以選擇編程語(yǔ)言,右上角復(fù)制到剪貼板

大功告成!

其實(shí)我本人平時(shí)都是用第一種,網(wǎng)站比較穩(wěn)定,基本沒(méi)出現(xiàn)過(guò)異常;有了這個(gè)神器就不用自己再構(gòu)造請(qǐng)求頭了,先一鍵生成,然后再根據(jù)需求調(diào)一調(diào)就好了,幾秒鐘就搞定了。

以上就是快速一鍵生成Python爬蟲請(qǐng)求頭的詳細(xì)內(nèi)容,更多關(guān)于快速一鍵生成Python爬蟲請(qǐng)求頭的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • keras獲得某一層或者某層權(quán)重的輸出實(shí)例

    keras獲得某一層或者某層權(quán)重的輸出實(shí)例

    今天小編就為大家分享一篇keras獲得某一層或者某層權(quán)重的輸出實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-01-01
  • Python強(qiáng)化練習(xí)之PyTorch opp算法實(shí)現(xiàn)月球登陸器

    Python強(qiáng)化練習(xí)之PyTorch opp算法實(shí)現(xiàn)月球登陸器

    在面向?qū)ο蟪霈F(xiàn)之前,我們采用的開發(fā)方法都是面向過(guò)程的編程(OPP)。面向過(guò)程的編程中最常用的一個(gè)分析方法是“功能分解”。我們會(huì)把用戶需求先分解成模塊,然后把模塊分解成大的功能,再把大的功能分解成小的功能,整個(gè)需求就是按照這樣的方式,最終分解成一個(gè)一個(gè)的函數(shù)
    2021-10-10
  • Python異常處理:try、except、else、finally的全面解析

    Python異常處理:try、except、else、finally的全面解析

    在Python中,異常是程序在運(yùn)行時(shí)發(fā)生的錯(cuò)誤,當(dāng)Python解釋器遇到一個(gè)它不能處理的錯(cuò)誤時(shí),它會(huì)拋出一個(gè)異常,異常處理的主要目的是在程序遇到錯(cuò)誤時(shí),提供一種方法來(lái)處理這些錯(cuò)誤,而不是簡(jiǎn)單地讓程序崩潰,本文介紹了Python異常處理:try、except、else、finally的全面解析
    2024-07-07
  • Python實(shí)現(xiàn)針對(duì)給定單鏈表刪除指定節(jié)點(diǎn)的方法

    Python實(shí)現(xiàn)針對(duì)給定單鏈表刪除指定節(jié)點(diǎn)的方法

    這篇文章主要介紹了Python實(shí)現(xiàn)針對(duì)給定單鏈表刪除指定節(jié)點(diǎn)的方法,結(jié)合實(shí)例形式分析了Python單鏈表的定義、節(jié)點(diǎn)添加、刪除、打印等相關(guān)操作技巧,需要的朋友可以參考下
    2018-04-04
  • Python中字典映射類型的學(xué)習(xí)教程

    Python中字典映射類型的學(xué)習(xí)教程

    這篇文章主要介紹了Python中字典映射類型的學(xué)習(xí)教程,是Python入門學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下
    2015-08-08
  • python獲取網(wǎng)絡(luò)圖片方法及整理過(guò)程詳解

    python獲取網(wǎng)絡(luò)圖片方法及整理過(guò)程詳解

    這篇文章主要介紹了python獲取網(wǎng)絡(luò)圖片方法及整理過(guò)程詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-12-12
  • Flask添加路由的三種方法

    Flask添加路由的三種方法

    Flask 是一個(gè)流行的 Python Web 框架,它提供了多種方法來(lái)添加路由,本文詳細(xì)的介紹了Flask添加路由的三種方法,感興趣的可以了解一下
    2023-11-11
  • python實(shí)現(xiàn)密度聚類(模板代碼+sklearn代碼)

    python實(shí)現(xiàn)密度聚類(模板代碼+sklearn代碼)

    這篇文章主要介紹了python實(shí)現(xiàn)密度聚類(模板代碼+sklearn代碼),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-04-04
  • python根據(jù)照片獲取地理位置及泄露防御

    python根據(jù)照片獲取地理位置及泄露防御

    這篇文章主要為大家介紹了python根據(jù)照片獲取地理位置及泄露防御,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-05-05
  • 使用Python編寫電腦定時(shí)關(guān)機(jī)小程序

    使用Python編寫電腦定時(shí)關(guān)機(jī)小程序

    這篇文章主要為大家詳細(xì)介紹了如何使用Python編寫電腦定時(shí)關(guān)機(jī)小程序,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2024-01-01

最新評(píng)論