解決Python3中的中文字符編碼的問題
更新時間:2018年07月18日 08:57:43 作者:FANDX
Unicode是一32位編碼格式,不適合用來傳輸和存儲,所以必須轉換成utf-8,gbk等等。這篇文章主要介紹了Python3中的解決中文字符編碼的問題,需要的朋友可以參考下
python3中str默認為Unicode的編碼格式
Unicode是一32位編碼格式,不適合用來傳輸和存儲,所以必須轉換成utf-8,gbk等等
所以在Python3中必須將str類型轉換成bytes類型的
在Python中使用encode的方式可以進行字符的編碼
實際用法:
>>>a = "中國" >>> a.encode("utf-8") b'\xe4\xb8\xad\xe5\x9b\xbd' >>> a.encode("gbk") b'\xd6\xd0\xb9\xfa'
總結:
- Python中str類型轉bytes類型,相當與Unicode轉gbk,utf-8。。。類型
- b'代表字符編碼格式為bytes,
- utf-8默認24位占3個8位16進制數
- gbk中國編碼默認占16位2個8位16進制數字
以上所述是小編給大家介紹的解決Python3中的中文字符編碼的問題,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!
相關文章
matplotlib之pyplot模塊之標題(title()和suptitle())
這篇文章主要介紹了matplotlib之pyplot模塊之標題(title()和suptitle()),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2021-02-02