Python中文分詞實現(xiàn)方法(安裝pymmseg)
本文實例講述了Python中文分詞實現(xiàn)方法。分享給大家供大家參考,具體如下:
在Python這pymmseg-cpp 還是十分方便的!
環(huán)境 ubuntu10.04 , python2.65
步驟:
1 下載mmseg-cpp的源代碼 http://code.google.com/p/pymmseg-cpp/
2 執(zhí)行:
tar -zxf pymmseg-cpp*.tar.gz //解壓后得到pymmseg 目錄 cd pymmseg\mmseg-cpp python build.py #生成 mmseg.so文件
3 將 pymmseg 目錄復(fù)制到 /usr/local/lib/python2.6/dist-packages 中
4 測試有沒有成功:
test.py文件:
from pymmseg import mmseg mmseg.dict_load_defaults() text = '今天的天氣真好啊,我們一起出去玩一下吧' algor = mmseg.Algorithm(text) for tok in algor: print '%s [%d..%d]' % (tok.text, tok.start, tok.end)
更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python圖片操作技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對大家Python程序設(shè)計有所幫助。
- python實現(xiàn)中文分詞FMM算法實例
- Python結(jié)巴中文分詞工具使用過程中遇到的問題及解決方法
- Python中文分詞工具之結(jié)巴分詞用法實例總結(jié)【經(jīng)典案例】
- python中文分詞教程之前向最大正向匹配算法詳解
- python中文分詞,使用結(jié)巴分詞對python進(jìn)行分詞(實例講解)
- python使用jieba實現(xiàn)中文分詞去停用詞方法示例
- python中文分詞庫jieba使用方法詳解
- Python中文分詞庫jieba,pkusegwg性能準(zhǔn)確度比較
- Python3爬蟲中關(guān)于中文分詞的詳解
- Python jieba 中文分詞與詞頻統(tǒng)計的操作
- Python中文分詞庫jieba(結(jié)巴分詞)詳細(xì)使用介紹
相關(guān)文章
深入淺析Python獲取對象信息的函數(shù)type()、isinstance()、dir()
這篇文章主要介紹了Python獲取對象信息的函數(shù)type()、isinstance()、dir()的相關(guān)知識,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下2018-09-09Python+PuLP實現(xiàn)線性規(guī)劃的求解
線性規(guī)劃(Linear?programming),在線性等式或不等式約束條件下求解線性目標(biāo)函數(shù)的極值問題,常用于解決資源分配、生產(chǎn)調(diào)度和混合問題。本文將利用PuLP實現(xiàn)線性規(guī)劃的求解,需要的可以參考一下2022-04-04