亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python結(jié)巴中文分詞工具使用過程中遇到的問題及解決方法

 更新時間:2017年04月15日 08:50:58   作者:捂汗縣長  
這篇文章主要介紹了Python結(jié)巴中文分詞工具使用過程中遇到的問題及解決方法,較為詳細(xì)的講述了Python結(jié)巴中文分詞工具的下載、安裝、使用方法及容易出現(xiàn)的問題與相應(yīng)解決方法,需要的朋友可以參考下

本文實例講述了Python結(jié)巴中文分詞工具使用過程中遇到的問題及解決方法。分享給大家供大家參考,具體如下:

結(jié)巴分詞是Python語言中效果最好的分詞工具,其功能包括:分詞、詞性標(biāo)注、關(guān)鍵詞抽取、支持用戶詞表等。這幾天一直在研究這個工具,在安裝與使用過程中遇到一些問題,現(xiàn)在把自己的一些方法帖出來分享一下。

官網(wǎng)地址:https://github.com/fxsjy/jieba

1、安裝。

按照官網(wǎng)上的說法,有三種安裝方式,

第一種是全自動安裝:easy_install jieba 或者 pip install jieba,可是并沒有找到它提供這個安裝程序。

第二種方法是半自動安裝:先下載http://pypi.python.org/pypi/jieba/ ,解壓后在cmd命令行中運行 python setup.py install。這里需要注意的是,默認(rèn)情況下,不能在cmd中直接運行python命令,需要把它的路徑加入到環(huán)境變量path中方可。我試過,可行。但是 這種方法安裝之后,結(jié)巴分詞功能只能在Python自帶的IDLE中使用。在含有PyDEV的MyEclipse中不能執(zhí)行“import jieba”命令,所以繼續(xù)嘗試第三種方法。

第三種方法是手動安裝:將jieba目錄放置于當(dāng)前目錄或者site-packages目錄。把下載到的jieba-0.30.zip解壓后,里面有個jibba的文件夾,把它復(fù)制到與你的Python程序相同的位置,這樣在程序中就可以執(zhí)行“import jieba”了。

2、關(guān)于分詞的實現(xiàn)

官網(wǎng)提供了分詞的基本用法示例 :

#encoding=utf-8
import jieba
seg_list = jieba.cut("我來到北京清華大學(xué)", cut_all=True)
print "Full Mode:", "/ ".join(seg_list) # 全模式
seg_list = jieba.cut("我來到北京清華大學(xué)", cut_all=False)
print "Default Mode:", "/ ".join(seg_list) # 精確模式
seg_list = jieba.cut("他來到了網(wǎng)易杭研大廈") # 默認(rèn)是精確模式
print ", ".join(seg_list)
seg_list = jieba.cut_for_search("小明碩士畢業(yè)于中國科學(xué)院計算所,后在日本京都大學(xué)深造") # 搜索引擎模式
print ", ".join(seg_list)

程序可以執(zhí)行,但是在MyEclipse中顯示中文為Unicode編碼,這不科學(xué)。

但是繼續(xù)執(zhí)行另一個詞性標(biāo)注的示例卻非常正常:

import jieba.posseg as pseg
words = pseg.cut("我愛北京天安門")
for w in words:
  print w.word, w.flag

所以我就想去分析一下它的源代碼,結(jié)果發(fā)現(xiàn)在jiba/_init_.py文件(這是實現(xiàn)分詞的文件)的第209行(cut函數(shù))中有關(guān)于檢查編碼的語句塊:

if not isinstance(sentence, unicode):
  try:
   sentence = sentence.decode('utf-8')
  except UnicodeDecodeError:
   sentence = sentence.decode('gbk','ignore')

而在jieba/posseg/_init_.py文件(這是實現(xiàn)詞性標(biāo)注的文件)第158行的cut函數(shù)中卻沒有發(fā)現(xiàn)此類代碼。所以我猜想,前者有檢查編碼的代碼就出現(xiàn)亂碼,而后者沒有檢查編碼的代碼而正常顯示,所以就把前者檢查編碼的代碼給注釋了,結(jié)果程序執(zhí)行報錯,只好又把人家的源碼還原,結(jié)果中文又正常顯示了!

運行效果如下圖:

以上只是對固定的中文字符串變量進(jìn)行分詞和詞性標(biāo)注,接下來的文章里我會嘗試從文件中讀取中文進(jìn)行分詞和詞性標(biāo)注。

更多關(guān)于Python相關(guān)內(nèi)容可查看本站專題:《Python字典操作技巧匯總》、《Python字符串操作技巧匯總》、《Python常用遍歷技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》及《Python入門與進(jìn)階經(jīng)典教程

希望本文所述對大家Python程序設(shè)計有所幫助。

相關(guān)文章

  • Python使用PIL進(jìn)行JPEG圖像壓縮的簡易教程

    Python使用PIL進(jìn)行JPEG圖像壓縮的簡易教程

    本文介紹了如何使用Python編程語言和wxPython圖形用戶界面庫進(jìn)行JPEG圖像的壓縮,通過添加滑塊控件,我們可以調(diào)整壓縮質(zhì)量,并將壓縮后的照片另存為原來的名稱加上后綴"壓縮+質(zhì)量數(shù)字"的新文件,需要的朋友可以參考下
    2023-09-09
  • Python腳本實現(xiàn)格式化css文件

    Python腳本實現(xiàn)格式化css文件

    這篇文章主要介紹了Python腳本實現(xiàn)格式化css文件,本文直接給出實現(xiàn)代碼,實現(xiàn)把壓縮后的CSS文件轉(zhuǎn)換成正??勺x的CSS格式,需要的朋友可以參考下
    2015-04-04
  • 基于Python實現(xiàn)新聞爬取系統(tǒng)

    基于Python實現(xiàn)新聞爬取系統(tǒng)

    這篇文章主要為大家詳細(xì)介紹了如何基于Python實現(xiàn)一個簡單的新聞爬取系統(tǒng),文中的示例代碼講解詳細(xì),具有一定的學(xué)習(xí)價值,感興趣的小伙伴可以了解一下
    2023-06-06
  • python playwright 自動等待和斷言詳解

    python playwright 自動等待和斷言詳解

    這篇文章主要為大家介紹了python playwright 自動等待和斷言,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2021-11-11
  • pip指定python位置安裝軟件包的方法

    pip指定python位置安裝軟件包的方法

    今天小編就為大家分享一篇pip指定python位置安裝軟件包的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-07-07
  • 利用python實現(xiàn)簡單的郵件發(fā)送客戶端示例

    利用python實現(xiàn)簡單的郵件發(fā)送客戶端示例

    下面小編就為大家分享一篇利用python實現(xiàn)簡單的郵件發(fā)送客戶端示例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2017-12-12
  • PyCharm常用配置和常用插件(小結(jié))

    PyCharm常用配置和常用插件(小結(jié))

    這篇文章主要介紹了PyCharm常用配置和常用插件(小結(jié)),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-02-02
  • Python中base64與xml取值結(jié)合問題

    Python中base64與xml取值結(jié)合問題

    這篇文章主要介紹了Python中base64與xml取值結(jié)合問題,本文通過實例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下
    2019-12-12
  • Python魔法方法詳解

    Python魔法方法詳解

    今天小編就為大家分享一篇關(guān)于Python魔法方法詳解,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-02-02
  • python畫一個圣誕樹實現(xiàn)示例

    python畫一個圣誕樹實現(xiàn)示例

    這篇文章主要為大家介紹了使用python畫一個圣誕樹實現(xiàn)示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-05-05

最新評論