Python簡單檢測文本類型的2種方法【基于文件頭及cchardet庫】
本文實(shí)例講述了Python簡單檢測文本類型的方法。分享給大家供大家參考,具體如下:
1、根據(jù)文件頭。
#是否為帶BOM頭的UTF8文件 def IsUtf8BomFile(pathfile): if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)): return True return False
2、用cchardet庫。
>>> import cchardet >>> cchardet.detect(open(pathfile, 'rb').read()) {'encoding': 'UTF-8', 'confidence': 0.9900000095367432}
更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python文件與目錄操作技巧匯總》、《Python文本文件操作技巧匯總》、《Python URL操作技巧總結(jié)》、《Python圖片操作技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》及《Python入門與進(jìn)階經(jīng)典教程》
希望本文所述對大家Python程序設(shè)計(jì)有所幫助。
- Python處理文件的方法(mimetypes和chardet)
- Python chardet庫識別編碼原理解析
- Python3 chardet模塊查看編碼格式的例子
- python中判斷文件編碼的chardet(實(shí)例講解)
- Python中動態(tài)檢測編碼chardet的使用教程
- python判斷字符串編碼的簡單實(shí)現(xiàn)方法(使用chardet)
- python字符串編碼識別模塊chardet簡單應(yīng)用
- Python使用chardet判斷字符編碼
- python使用chardet判斷字符串編碼的方法
- 使用python的chardet庫獲得文件編碼并修改編碼
- Python爬蟲之必備chardet庫
相關(guān)文章
Python的網(wǎng)絡(luò)編程庫Gevent的安裝及使用技巧
Gevent庫的奧義在于并發(fā)式的高性能網(wǎng)絡(luò)程序設(shè)計(jì)支持,這里我們將來講解Python的網(wǎng)絡(luò)編程庫Gevent的安裝及使用技巧,來看一下Gevent支持的多進(jìn)程程序編寫:2016-06-06Python實(shí)現(xiàn)圖像增強(qiáng)
這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)圖像增強(qiáng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-08-08用python登錄帶弱圖片驗(yàn)證碼的網(wǎng)站
這篇文章主要介紹了用python登錄帶弱圖片驗(yàn)證碼的網(wǎng)站方法,幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下2021-03-03