亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python實(shí)現(xiàn)快速計(jì)算詞頻功能示例

 更新時(shí)間:2018年06月25日 08:51:01   作者:chenKFKevin  
這篇文章主要介紹了Python實(shí)現(xiàn)快速計(jì)算詞頻功能,結(jié)合實(shí)例形式總結(jié)分析了Python使用nltk庫(kù)進(jìn)行詞頻計(jì)算功能的相關(guān)操作技巧,需要的朋友可以參考下

本文實(shí)例講述了Python實(shí)現(xiàn)快速計(jì)算詞頻功能。分享給大家供大家參考,具體如下:

這幾天看到一位同事的代碼,方法如下:

def cut_word(body):
  temp_dict={}
  if body is not None:
    temp=jieba.cut(body)
    for t in temp:
      temp_dict[t]=1
  else:
    pass
  return temp_dict

這個(gè)函數(shù)的功能是,輸入一段字符串,比如:'今天天氣很不錯(cuò)',輸出一個(gè)字典,key為使用結(jié)巴的cut方法之后切分的詞,value為1,如:{'很':1,'今天天氣':1,'不錯(cuò)': 1}。

然后我看到同事的另一個(gè)方法:

def union_dict(x,y):
  _keys = set(sum([obj.keys() for obj in [x,y]],[]))
  _total = {}
  for _key in _keys:
    _total[_key] = sum([obj.get(_key,0) for obj in [x,y]])
  return _total

是這樣調(diào)用的:

final_dict=reduce(union_dict,result)

result是這樣產(chǎn)生的:

result=df['body'].apply(cut_word)

也就是把df的body列每一行進(jìn)行cut_word函數(shù)操作(即將字符串轉(zhuǎn)換成一個(gè)字典)。

result的類(lèi)型是series,隨后對(duì)result用reduce函數(shù)進(jìn)行union_dict操作。

union_dict的作用是,輸入兩個(gè)字典,比如{'很':1,'今天天氣':1,'不錯(cuò)': 1}和{'很':1,'今天天氣':1,'差': 1},對(duì)key相同的進(jìn)行value求和,也就是輸出會(huì)變成{'很':2,'今天天氣':2,'不錯(cuò)': 1,'差':1}。

所以這一系列的操作其實(shí)是為了計(jì)算一大堆文字的詞頻數(shù),但同事使用的是對(duì)每一行分別進(jìn)行拆分,生成字典,隨后

對(duì)字典進(jìn)行合并,其實(shí)有些麻煩。

再學(xué)習(xí)自然語(yǔ)言處理的時(shí)候,我了解到nltk有一個(gè)方法,可以直接計(jì)算詞頻,用在此處正好。

# -*- coding:utf-8 -*-
import nltk
import jieba
str = '今天天氣很不錯(cuò)。今天天氣很差'
a = list(jieba.cut(str))
cfd = nltk.FreqDist(a)

結(jié)果直接是一個(gè)帶有頻數(shù)的字典:{'很':2,'今天天氣':2,'不錯(cuò)': 1,'很差':1,'。'}

由于同事的函數(shù)cut_word對(duì)每個(gè)詞只計(jì)一次頻數(shù),所以不能直接拼接字符串后調(diào)用FreqDist函數(shù),需要對(duì)每個(gè)cut出來(lái)的列表去重,隨后再拼接為大字符串調(diào)用FreqDist,這也比之前寫(xiě)這兩個(gè)函數(shù)簡(jiǎn)單許多。

對(duì)于普通的計(jì)算頻數(shù)的需求來(lái)說(shuō),這個(gè)函數(shù)能直接解決,十分方便。

更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專(zhuān)題:《Python數(shù)學(xué)運(yùn)算技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門(mén)與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總

希望本文所述對(duì)大家Python程序設(shè)計(jì)有所幫助。

相關(guān)文章

  • Python入門(mén)之三角函數(shù)atan2()函數(shù)詳解

    Python入門(mén)之三角函數(shù)atan2()函數(shù)詳解

    這篇文章主要介紹了Python入門(mén)之三角函數(shù)atan2()函數(shù)詳解,分享了其實(shí)例,具有一定參考價(jià)值,需要的朋友可以了解下。
    2017-11-11
  • Python configparser模塊應(yīng)用過(guò)程解析

    Python configparser模塊應(yīng)用過(guò)程解析

    這篇文章主要介紹了Python configparser模塊應(yīng)用過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-08-08
  • 使用Python和jieba庫(kù)生成中文詞云的示例代碼

    使用Python和jieba庫(kù)生成中文詞云的示例代碼

    在文本分析和數(shù)據(jù)可視化的領(lǐng)域中,詞云是一種展示文本數(shù)據(jù)中關(guān)鍵詞頻率的直觀(guān)方式,Python作為一種強(qiáng)大的編程語(yǔ)言,提供了多種庫(kù)來(lái)幫助我們生成詞云,在本文中,我們將通過(guò)一個(gè)簡(jiǎn)單的示例,展示如何使用Python生成中文詞云,需要的朋友可以參考下
    2024-07-07
  • Python計(jì)算一個(gè)文件里字?jǐn)?shù)的方法

    Python計(jì)算一個(gè)文件里字?jǐn)?shù)的方法

    這篇文章主要介紹了Python計(jì)算一個(gè)文件里字?jǐn)?shù)的方法,涉及Python文件操作及內(nèi)容遍歷的相關(guān)技巧,需要的朋友可以參考下
    2015-06-06
  • CentOS 6.5下安裝Python 3.5.2(與Python2并存)

    CentOS 6.5下安裝Python 3.5.2(與Python2并存)

    這篇文章主要給大家介紹了在CentOS 6.5下安裝Python 3.5.2的方法教程,安裝后的python3與Python2并存,文中分享了詳細(xì)的方法步驟,對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值,下面來(lái)一起看看吧。
    2017-06-06
  • python爬取招聘要求等信息實(shí)例

    python爬取招聘要求等信息實(shí)例

    在本篇文章里小編給大家整理了關(guān)于python爬取招聘要求等信息實(shí)例內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。
    2020-11-11
  • Python基礎(chǔ)之函數(shù)與控制語(yǔ)句

    Python基礎(chǔ)之函數(shù)與控制語(yǔ)句

    在調(diào)用函數(shù)的時(shí)候,如果沒(méi)有按照形參傳入指定的參數(shù),就會(huì)報(bào)錯(cuò),這時(shí),我們可以為函數(shù)的參數(shù)設(shè)置默認(rèn)的值,下面這篇文章主要給大家介紹了關(guān)于Python基礎(chǔ)之函數(shù)與控制語(yǔ)句的相關(guān)資料,需要的朋友可以參考下
    2022-04-04
  • PyCharm安裝第三方庫(kù)如Requests的圖文教程

    PyCharm安裝第三方庫(kù)如Requests的圖文教程

    今天小編就為大家分享一篇PyCharm安裝第三方庫(kù)如Requests的圖文教程,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-05-05
  • python pandas分組聚合詳細(xì)

    python pandas分組聚合詳細(xì)

    分組聚合是數(shù)據(jù)處理中常見(jiàn)的場(chǎng)景,在pandas中用groupby方法實(shí)現(xiàn)分組操作,用agg方法實(shí)現(xiàn)聚合操作,在這篇文章里有主要介紹,感興趣的朋友請(qǐng)參考下文
    2021-09-09
  • 基于pip install django失敗時(shí)的解決方法

    基于pip install django失敗時(shí)的解決方法

    今天小編就為大家分享一篇基于pip install django失敗時(shí)的解決方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-06-06

最新評(píng)論