python中文編碼問題小結
中文編碼問題一直是Python程序設計中很頭痛的問題,本文對此較為詳細的進行了總結歸納。具體如下:
當字符串是:'\u4e2d\u56fd'
>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66'] >>>str=s[0].decode('unicode_escape') #.encode("EUC_KR") >>>print str 中國
當字符串是:' 东亚学团一中'
>>>print unichr(19996) 東
ord()支持unicode,可以顯示特定字符的unicode號碼,如:
>>>print ord('A') 65
只要和Unicode連接,就會產(chǎn)生Unicode字串。如:
>>> 'help' 'help' >>> 'help,' + u'python' u'help,python'
對于ASCII(7位)兼容的字串,可和內(nèi)置的str()函數(shù)把Unicode字串轉換成ASCII字串。如:
>>> str(u'hello world') 'hello world'
對幾個概念的理解:
ASCII碼 用數(shù)據(jù)字 對應 相應的字符 如下圖所示:
而中文 就是區(qū)位碼對應漢字。如:“好” 的ASCII碼為: 22909
unicode 編碼 每個國家分一塊。它有UTF-8、UTF-16、UTF-32等形式
中文范圍 4E00-9FBF:這個范圍內(nèi)有 gbk,gb2312,
utf-8是基于unicode的 國際化的場合適合使用
gb2312和gb2312都是國標碼 出現(xiàn)的較早 主要用于編解碼常用漢字
希望本文所述對大家的Python程序設計有所幫助。
相關文章
Python遠程開發(fā)環(huán)境部署與調(diào)試過程圖解
這篇文章主要介紹了Python遠程開發(fā)環(huán)境部署與調(diào)試過程圖解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2019-12-12Ubuntu 20.04安裝Pycharm2020.2及鎖定到任務欄的問題(小白級操作)
這篇文章主要介紹了Ubuntu 20.04安裝Pycharm2020.2及鎖定到任務欄的問題,本教程給大家講解的很詳細,非常適合小白級操作,需要的朋友可以參考下2020-10-10Flask框架運用Ajax實現(xiàn)數(shù)據(jù)交互的示例代碼
使用Ajax技術網(wǎng)頁應用能夠快速地將增量更新呈現(xiàn)在用戶界面上,而不需要重載刷新整個頁面,這使得程序能夠更快地回應用戶的操作,本文將簡單介紹使用AJAX如何實現(xiàn)前后端數(shù)據(jù)通信2022-11-11使用Pytorch實現(xiàn)two-head(多輸出)模型的操作
這篇文章主要介紹了使用Pytorch實現(xiàn)two-head(多輸出)模型的操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-05-05