python字符串編碼識(shí)別模塊chardet簡單應(yīng)用
python的字符串編碼識(shí)別模塊(第三方庫):
官方地址: http://pypi.python.org/pypi/chardet
import chardet
import urllib
# 可根據(jù)需要,選擇不同的數(shù)據(jù)
TestData = urllib.urlopen('http://www.baidu.com/').read()
print chardet.detect(TestData)
# 運(yùn)行結(jié)果:
# {'confidence': 0.99, 'encoding': 'GB2312'}
運(yùn)行結(jié)果表示有99%的概率認(rèn)為這段代碼是GB2312編碼方式。
import urllib
from chardet.universaldetector import UniversalDetector
usock = urllib.urlopen('http://www.baidu.com/')
# 創(chuàng)建一個(gè)檢測對(duì)象
detector = UniversalDetector()
for line in usock.readlines():
# 分塊進(jìn)行測試,直到達(dá)到閾值
detector.feed(line)
if detector.done: break
# 關(guān)閉檢測對(duì)象
detector.close()
usock.close()
# 輸出檢測結(jié)果
print detector.result
# 運(yùn)行結(jié)果:
# {'confidence': 0.99, 'encoding': 'GB2312'}
應(yīng)用背景,如果要對(duì)一個(gè)大文件進(jìn)行編碼識(shí)別,使用這種高級(jí)的方法,可以只讀一部,去判別編碼方式從而提高檢測速度。如果希望使用一個(gè)檢測對(duì)象檢測多個(gè)數(shù)據(jù),在每次檢測完,一定要運(yùn)行一下detector.reset()。清除之前的數(shù)據(jù)。
以上所述就是本文的全部內(nèi)容了,希望大家能夠喜歡。
- Python處理文件的方法(mimetypes和chardet)
- Python chardet庫識(shí)別編碼原理解析
- Python3 chardet模塊查看編碼格式的例子
- python中判斷文件編碼的chardet(實(shí)例講解)
- Python中動(dòng)態(tài)檢測編碼chardet的使用教程
- Python簡單檢測文本類型的2種方法【基于文件頭及cchardet庫】
- python判斷字符串編碼的簡單實(shí)現(xiàn)方法(使用chardet)
- Python使用chardet判斷字符編碼
- python使用chardet判斷字符串編碼的方法
- 使用python的chardet庫獲得文件編碼并修改編碼
- Python爬蟲之必備chardet庫
相關(guān)文章
一小時(shí)學(xué)會(huì)TensorFlow2之基本操作2實(shí)例代碼
這篇文章主要介紹了TensorFlow2的基本操作和實(shí)例代碼,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-09-09
Python調(diào)用百度根據(jù)經(jīng)緯度查詢地址的示例代碼
今天小編就為大家分享一篇Python調(diào)用百度根據(jù)經(jīng)緯度查詢地址的示例代碼,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-07-07
Python實(shí)現(xiàn)數(shù)據(jù)透視表詳解
今天小編就為大家分享一篇用Python實(shí)現(xiàn)數(shù)據(jù)的透視表的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-10-10
Python?NumPy科學(xué)計(jì)算庫的高級(jí)應(yīng)用
這篇文章主要為大家介紹了Python?NumPy科學(xué)計(jì)算庫的高級(jí)應(yīng)用深入詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-07-07
python實(shí)現(xiàn)郵件自動(dòng)發(fā)送
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)郵件自動(dòng)發(fā)送,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-08-08
Python打包exe時(shí)各種異常處理方案總結(jié)
今天教大家用Python打包exe時(shí)各種異常處理的方案總結(jié),下文中有非常詳細(xì)的介紹,對(duì)正在學(xué)習(xí)python的小伙伴們很有幫助喲,需要的朋友可以參考下2021-05-05
在python3環(huán)境下的Django中使用MySQL數(shù)據(jù)庫的實(shí)例
下面小編就為大家?guī)硪黄趐ython3環(huán)境下的Django中使用MySQL數(shù)據(jù)庫的實(shí)例。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-08-08
Python調(diào)用C語言的實(shí)現(xiàn)
這篇文章主要介紹了Python調(diào)用C語言的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07

