Python語(yǔ)言檢測(cè)模塊langid和langdetect的使用實(shí)例
之前使用數(shù)據(jù)編碼風(fēng)格檢測(cè)的模塊chardet比較多一點(diǎn),今天提到的兩個(gè)模塊是檢測(cè)數(shù)據(jù)的語(yǔ)言類型,比如是:中文還是英文,模塊的使用方法也比較簡(jiǎn)單,我這里只是簡(jiǎn)單地使用了一下,因?yàn)轫?xiàng)目中有這個(gè)需求,所以拿來(lái)用了一下,并沒(méi)有深入地去研究這兩個(gè)模塊,模塊的地址鏈接我都給出來(lái)了,需要的話可以去研究下:
def langidFunc(): ''' https://github.com/yishuihanhan/langid.py ''' print langid.classify("We Are Family") print langid.classify("Questa e una prova") print langid.classify("我們都有一個(gè)家") identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True) print identifier.classify("We Are Family") def langdetectFunc(): ''' https://github.com/yishuihanhan/langdetect ''' s1=u"本篇文章主要介紹兩款語(yǔ)言探測(cè)工具,用于區(qū)分文本到底是什么語(yǔ)言," s2=u'We are pleased to introduce today a new technology' print detect(s1) print detect(s2) print detect_langs(s2) # detect_langs()輸出探測(cè)出的所有語(yǔ)言類型及其所占的比例 print detect_langs("Otec matka syn.")
結(jié)果如下:
('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接
- Python爬蟲(chóng)之UserAgent的使用實(shí)例
- Python快速轉(zhuǎn)換numpy數(shù)組中Nan和Inf的方法實(shí)例說(shuō)明
- Python基于滑動(dòng)平均思想實(shí)現(xiàn)缺失數(shù)據(jù)填充的方法
- 利用Python對(duì)文件夾下圖片數(shù)據(jù)進(jìn)行批量改名的代碼實(shí)例
- Python基于opencv調(diào)用攝像頭獲取個(gè)人圖片的實(shí)現(xiàn)方法
- 啥是佩奇?使用Python自動(dòng)繪畫(huà)小豬佩奇的代碼實(shí)例
- Python實(shí)戰(zhàn)購(gòu)物車項(xiàng)目的實(shí)現(xiàn)參考
- Python英文文本分詞(無(wú)空格)模塊wordninja的使用實(shí)例
- Python基于datetime或time模塊分別獲取當(dāng)前時(shí)間戳的方法實(shí)例
- Python多進(jìn)程fork()函數(shù)詳解
相關(guān)文章
關(guān)于python3安裝pip及requests庫(kù)的導(dǎo)入問(wèn)題
小編最近快畢業(yè)了,閑著無(wú)事學(xué)習(xí)下python的內(nèi)容在學(xué)習(xí)到requsets庫(kù)的導(dǎo)入問(wèn)題時(shí)遇到一些問(wèn)題,通過(guò)查找相關(guān)資料問(wèn)題順利解決,今天小編把問(wèn)題解決思路及注意事項(xiàng)分享給大家供大家參考學(xué)習(xí)2021-05-05純numpy卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)手寫(xiě)數(shù)字識(shí)別的實(shí)踐
本文主要介紹了純numpy卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)手寫(xiě)數(shù)字識(shí)別的實(shí)踐,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2022-08-08python爬蟲(chóng)要用到的庫(kù)總結(jié)
在本篇內(nèi)容中小編給大家整理的是關(guān)于python爬蟲(chóng)要用到的庫(kù)總結(jié)內(nèi)容,需要的朋友們可以學(xué)習(xí)下。2020-07-07python用moviepy對(duì)視頻進(jìn)行簡(jiǎn)單的處理
這篇文章主要介紹了python如何用moviepy對(duì)視頻進(jìn)行簡(jiǎn)單的處理,幫助大家更好的利用python處理視頻,感興趣的朋友可以了解下2021-03-03