亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python3?requests中文亂碼之壓縮格式問題解析

 更新時間:2022年08月19日 15:40:57   作者:Jason_WangYing  
這篇文章主要介紹了python3?requests中文亂碼問題之壓縮格式問題,我們在爬蟲時,經(jīng)常會遇見中文亂碼問題,之前都是編碼格式的問題,很少遇見由于壓縮格式造成的編碼混亂問題,特記錄下,需要的朋友可以參考下

我們在爬蟲時,經(jīng)常會遇見中文亂碼問題,之前都是編碼格式的問題,很少遇見由于壓縮格式造成的編碼混亂問題,特記錄下。先看下混亂的編碼樣式。

b'a\xd4l\x00 G6\xb5\xaa\xdf\xeaAy\x0f\xa0\xcaoZ\x92I&\x88\x14$p\xd8N\xb8\xaau\x02\xab\xdf\xeb\xac\x89r\x112q\x91\x99\xd8t\x1b\xa1"\x0b]\xb7\xf2\xee\xde[\xe8\x8a.\xd1\xa5\xe9(ZqE\xa1q\x08\x9dV\x0f\xba\x90\x11\x16K\x10^~\xc5|7\x02\x17\xd6\xef\t\x17\xea5\xe6}\xb6\x95\xf1\x91\xf6H\xa9o+s\xd3\xadv\xa9\xff\xb3\xad\xec\

 我們先看下header

header = {
    "Content-Type":"application/json",
    "Accept": "application/json",
    "Accept-Encoding": "gzip, deflate, br",
    "Accept-Language": "zh-CN,zh;q=0.9",
    "Agw-Js-Conv": 'str',
    "Connection": "keep-alive",
    "Cookie":"***",
    "Host": "life.douyin.com",
    "Referer": "https://life.douyin.com/p/login",
    "sec-ch-ua": '"Chromium";v="104", " Not A;Brand";v="99", "Google Chrome";v="104"',
    "sec-ch-ua-platform": "Android",
    "Sec-Fetch-Dest": "empty",
    "Sec-Fetch-Mode": "cors",
    "Sec-Fetch-Site": "same-origin",
    "User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Mobile Safari/537.36",
    "x-secsdk-csrf-token": "*",
}

我們注意到Content-Type是application/json,我們的數(shù)據(jù)是jason格式,這時要考慮中文轉(zhuǎn)換問題,用utf-8來把中文從unicode轉(zhuǎn)過來。

我們轉(zhuǎn)了后發(fā)現(xiàn)解析出來的數(shù)據(jù)還是亂碼,這是什么情況呢?我們先看下請求頭和響應(yīng)頭關(guān)于字段的解釋

請求頭字段說明響應(yīng)頭字段
Accept告知服務(wù)器發(fā)送何種媒體類型Content-Type
Accept-Language告知服務(wù)器發(fā)送何種語言Content-Language
Accept-Charset告知服務(wù)器發(fā)送何種字符集Content-Type
Accept-Encoding告知服務(wù)器采用何種壓縮方式Content-Encoding

我們再看"Accept-Encoding",這個意思就是返回的數(shù)據(jù)使用的是什么壓縮格式,平常我們經(jīng)常使用"gzip, deflate",這是我們發(fā)現(xiàn)后面還跟了個br,br是什么格式呢?

br 指的是 Brotli,是一種全新的數(shù)據(jù)格式,無損壓縮,壓縮比極高(比gzip高的)

這需要單獨導(dǎo)入brotil庫

安裝

pip install Brotli

安裝后我們使用brotli來解析數(shù)據(jù)即可,

data = brotli.decompress(res.content)

還有一種最簡單的方法,我們修改請求頭,高速服務(wù)器,我不支持br格式,這樣服務(wù)器就不會用br來壓縮數(shù)據(jù)了

"Accept-Encoding": "gzip, deflate",

補充下:BrotliDecompress failed錯誤問題

剛開始我用request庫時發(fā)現(xiàn),對返回的response數(shù)據(jù)必須要引入brotli,這樣才能解壓縮數(shù)據(jù),如果不引入無法解析數(shù)據(jù),還是會反回亂碼數(shù)據(jù)

import brotli
res = requests.get(url,headers = header,verify=False)
print(res.content)
print(res.text)
 
if res.headers.get('Content-Encoding') == 'br':
    data = brotli.decompress(res.content)
    print(data.decode('utf-8'))
else:
    print(res.text)

但是在我使用httpx后,發(fā)先再使用brotli.decompress()方法,會造成報錯

Traceback (most recent call last):
  File "/****", line 61, in <module>
    data = brotli.decompress(res.content)
brotli.error: BrotliDecompress failed

這時無需引入brotli庫,httpx會自動引入,自動調(diào)用

import json
finish_data = []
with httpx.Client(http2=True, verify=False) as client:
    cookies = httpx.Cookies()
    res = client.get(url,headers = header)
    if res.headers.get('Content-Encoding') == 'br':
       data = res.content.decode('utf-8')
       print(data)
       
       else:
          print(res.text)

到此這篇關(guān)于python3 requests中文亂碼問題之壓縮格式問題的文章就介紹到這了,更多相關(guān)python3 requests中文亂碼內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 解決Keras中循環(huán)使用K.ctc_decode內(nèi)存不釋放的問題

    解決Keras中循環(huán)使用K.ctc_decode內(nèi)存不釋放的問題

    這篇文章主要介紹了解決Keras中循環(huán)使用K.ctc_decode內(nèi)存不釋放的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • 一篇文章帶你了解kali局域網(wǎng)攻擊

    一篇文章帶你了解kali局域網(wǎng)攻擊

    這篇文章主要給大家介紹了kali的局域網(wǎng)攻擊,小編覺得這篇文章還是不錯的,使用起來也是非常方便的,需要的朋友可以參考下
    2021-08-08
  • Python+Appium實現(xiàn)自動化測試的使用步驟

    Python+Appium實現(xiàn)自動化測試的使用步驟

    這篇文章主要介紹了Python+Appium實現(xiàn)自動化測試的使用步驟,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-03-03
  • Python文件操作利器的十大庫使用實例

    Python文件操作利器的十大庫使用實例

    Python擁有多個庫用于文件操作,提供了各種功能來管理、讀取和寫入文件,這些庫覆蓋了從基本的文件系統(tǒng)交互到高級的文件壓縮和數(shù)據(jù)格式處理等多個方面,文件操作是編程中不可或缺的一部分,因此了解這些庫對于開發(fā)者來說是至關(guān)重要的
    2024-01-01
  • 基于Python制作IP查詢網(wǎng)站

    基于Python制作IP查詢網(wǎng)站

    這篇文章主要為大家詳細(xì)介紹了如何使用python快速做一個簡易查內(nèi)網(wǎng)IP網(wǎng)站,通過電腦訪問網(wǎng)站就知道自己的IP地址,感興趣的小伙伴可以了解下
    2024-10-10
  • python可視化hdf5文件的操作

    python可視化hdf5文件的操作

    這篇文章主要介紹了python可視化hdf5文件的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-05-05
  • Python?copy()與deepcopy()方法之間有什么區(qū)別

    Python?copy()與deepcopy()方法之間有什么區(qū)別

    這篇文章主要介紹了Python中的copy()和deepcopy(),下面詳細(xì)介紹該內(nèi)容并附上詳細(xì)代碼,需要的朋友可以參考一下文章的具體內(nèi)容,希望對你有所幫助
    2022-10-10
  • Python函數(shù)中閉包和延遲綁定詳情

    Python函數(shù)中閉包和延遲綁定詳情

    這篇文章主要介紹了Python函數(shù)中閉包和延遲綁定詳情,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下
    2022-05-05
  • Python中的遠(yuǎn)程調(diào)試與性能優(yōu)化技巧分享

    Python中的遠(yuǎn)程調(diào)試與性能優(yōu)化技巧分享

    Python 是一種簡單易學(xué)、功能強大的編程語言,廣泛應(yīng)用于各種領(lǐng)域,包括網(wǎng)絡(luò)編程、數(shù)據(jù)分析、人工智能等,在開發(fā)過程中,我們經(jīng)常會遇到需要遠(yuǎn)程調(diào)試和性能優(yōu)化的情況,本文將介紹如何利用遠(yuǎn)程調(diào)試工具和性能優(yōu)化技巧來提高 Python 應(yīng)用程序的效率和性能
    2024-05-05
  • 詳解用pyecharts Geo實現(xiàn)動態(tài)數(shù)據(jù)熱力圖城市找不到問題解決

    詳解用pyecharts Geo實現(xiàn)動態(tài)數(shù)據(jù)熱力圖城市找不到問題解決

    這篇文章主要介紹了詳解用pyecharts Geo實現(xiàn)動態(tài)數(shù)據(jù)熱力圖城市找不到問題解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-06-06

最新評論