python同義詞替換的實(shí)現(xiàn)(jieba分詞)
TihuanWords.txt文檔格式
注意:同一行的詞用單個(gè)空格隔開,每行第一個(gè)詞為同行詞的替換詞。
年休假 年假 年休
究竟 到底
回家場(chǎng)景 我回來(lái)了
代碼
import jieba def replaceSynonymWords(string1): # 1讀取同義詞表,并生成一個(gè)字典。 combine_dict = {} # synonymWords.txt是同義詞表,每行是一系列同義詞,用空格分割 for line in open("TihuanWords.txt", "r", encoding='utf-8'): seperate_word = line.strip().split(" ") num = len(seperate_word) for i in range(1, num): combine_dict[seperate_word[i]] = seperate_word[0] print(seperate_word) print(combine_dict) # 2提升某些詞的詞頻,使其能夠被jieba識(shí)別出來(lái) jieba.suggest_freq("年休假", tune=True) # 3將語(yǔ)句切分成單詞 seg_list = jieba.cut(string1, cut_all=False) f = "/".join(seg_list).encode("utf-8") f = f.decode("utf-8") print(f) # 4返回同義詞替換后的句子 final_sentence = " " for word in f.split('/'): if word in combine_dict: word = combine_dict[word] final_sentence += word else: final_sentence += word # print final_sentence return final_sentence string1 = '年休到底放幾天?' print(replaceSynonymWords(string1))
結(jié)果
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
python中對(duì)列表的相關(guān)操作你知道嗎
這篇文章主要為大家詳細(xì)介紹了python中對(duì)列表的相關(guān)操作,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助2022-03-03python基礎(chǔ)之編碼規(guī)范總結(jié)
今天帶大家來(lái)學(xué)習(xí)python基礎(chǔ)知識(shí),文中對(duì)python編碼規(guī)范作了詳細(xì)的介紹,對(duì)正在學(xué)習(xí)python的小伙伴們很有幫助,需要的朋友可以參考下2021-05-05解決pytorch?model代碼內(nèi)tensor?device不一致的問(wèn)題
這篇文章主要介紹了pytorch?model代碼內(nèi)tensor?device不一致的問(wèn)題,本文給大家分享完美解決方案,對(duì)pytorch?tensor?device不一致問(wèn)題解決方案感興趣的朋友跟隨小編一起看看吧2023-07-07使用python+Pyqt5實(shí)現(xiàn)串口調(diào)試助手
這篇文章主要介紹了使用python+Pyqt5實(shí)現(xiàn)串口調(diào)試助手,串口通訊程序首先要對(duì)串口進(jìn)行設(shè)置,如波特率、數(shù)據(jù)位、停止位、校驗(yàn)位等,需要的朋友可以參考下2022-04-04簡(jiǎn)單利用conda安裝tensorflow-gpu=2.2.0的過(guò)程及問(wèn)題解決
這篇文章主要介紹了簡(jiǎn)單利用conda安裝tensorflow-gpu=2.2.0,本文給大家詳細(xì)分享問(wèn)題記錄及錯(cuò)誤問(wèn)題解決方案,需要的朋友可以參考下2023-01-01