亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python snownlp情感分析簡(jiǎn)易demo(分享)

 更新時(shí)間:2017年06月04日 07:31:16   投稿:jingxian  
下面小編就為大家?guī)?lái)一篇python snownlp情感分析簡(jiǎn)易demo(分享)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧

SnowNLP是國(guó)人開(kāi)發(fā)的python類(lèi)庫(kù),可以方便的處理中文文本內(nèi)容,是受到了TextBlob的啟發(fā)而寫(xiě)的,由于現(xiàn)在大部分的自然語(yǔ)言處理庫(kù)基本都是針對(duì)英文的,于是寫(xiě)了一個(gè)方便處理中文的類(lèi)庫(kù),并且和TextBlob不同的是,這里沒(méi)有用NLTK,所有的算法都是自己實(shí)現(xiàn)的,并且自帶了一些訓(xùn)練好的字典。注意本程序都是處理的unicode編碼,所以使用時(shí)請(qǐng)自行decode成unicode。MIT許可下發(fā)行。

github 主頁(yè)

我自己修改了上文鏈接中的python代碼并加入些許注釋?zhuān)苑奖隳愕睦斫猓?/span>

from snownlp import SnowNLP
text = u'''
自然語(yǔ)言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向。
它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法。
自然語(yǔ)言處理是一門(mén)融語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。
因此,這一領(lǐng)域的研究將涉及自然語(yǔ)言,即人們?nèi)粘J褂玫恼Z(yǔ)言,
所以它與語(yǔ)言學(xué)的研究有著密切的聯(lián)系,但又有重要的區(qū)別。
自然語(yǔ)言處理并不是一般地研究自然語(yǔ)言,
而在于研制能有效地實(shí)現(xiàn)自然語(yǔ)言通信的計(jì)算機(jī)系統(tǒng),
特別是其中的軟件系統(tǒng)。因而它是計(jì)算機(jī)科學(xué)的一部分。
'''
s = SnowNLP(text)
print(s.keywords(6)) # [u'語(yǔ)言', u'自然', u'計(jì)算機(jī)'] 不能用tags輸出關(guān)鍵字.
s.summary(3) # [u'因而它是計(jì)算機(jī)科學(xué)的一部分', u'自然語(yǔ)言處理是一門(mén)融語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、
# 數(shù)學(xué)于一體的科學(xué)', u'自然語(yǔ)言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向']s.sentences
# print(s.sentences)
print(s.sentiments) # 1.0
s = SnowNLP([[u'這篇', u'文章'],
       [u'那篇', u'論文'],
       [u'這個(gè)']])
# print(s.tf)
# print(s.idf)
# print(s.sim([u'文章'])) # [0.3756070762985226, 0, 0]

在編譯運(yùn)行之前,先得安裝snownlp包,后續(xù)還有pylab,pandas模塊:
在VS Code終端(查看->集成終端)里面輸入:
pip install snownlp

pip install pylab

pip install pandas

前提是你安裝了pip,若是pip沒(méi)有安裝可以查看我之前的 文章

在VS Code中我們可以右鍵模塊名查看定義,便能看到模塊的實(shí)現(xiàn)了.不得不說(shuō)VS Code很強(qiáng)大,希望微軟能這么一直走下去,走向開(kāi)源走向跨平臺(tái)??!

然后我隨便提取了《心靈捕手》豆瓣網(wǎng)評(píng),放在了txt中:

It is not ur fault!

我是在電視上偶爾才看到這個(gè)電影的,當(dāng)時(shí)看的時(shí)候真的很感人。 為什么會(huì)有這么天才的人,卻有著這樣子曲折的人生。
是認(rèn)為劇本很好卻沒(méi)有被完全拍出來(lái):) 對(duì)演員的表演還是心存質(zhì)疑一點(diǎn)點(diǎn)~ 呵呵

好評(píng)

前幾日剛剛看過(guò),一部觸動(dòng)心靈的電影,尋找真正的人生

這篇影評(píng)寫(xiě)的很棒,我的眼睛濕潤(rùn)了

很好的片子

最后就是處理的程序了:

from snownlp import SnowNLP
import pandas as pd
import pylab as pl
txt = open('F:/_analyse_Emotion.txt')
text = txt.readlines()
txt.close()
print('讀入成功')
sentences = []
senti_score = []
for i in text:
  a1 = SnowNLP(i)
  a2 = a1.sentiments
  sentences.append(i) # 語(yǔ)序...
  senti_score.append(a2)
  print('doing')
table = pd.DataFrame(sentences, senti_score)
# table.to_excel('F:/_analyse_Emotion.xlsx', sheet_name='Sheet1')
# ts = pd.Series(sentences, senti_score)
# ts = ts.cumsum()
# print(table)
x = [1, 2, 3, 4, 5, 6, 7, 8]
pl.mpl.rcParams['font.sans-serif'] = ['SimHei']
pl.plot(x, senti_score)
pl.title(u'心 靈 捕 手 網(wǎng) 評(píng)')
pl.xlabel(u'評(píng) 論 用 戶(hù)')
pl.ylabel(u'情 感 程 度')
pl.show()

最后的效果:

可能有些不準(zhǔn)確,我也是隨便提取的數(shù)據(jù),不過(guò)snownlp還是號(hào)稱(chēng)情感分析準(zhǔn)確很高的!

以上這篇python snownlp情感分析簡(jiǎn)易demo(分享)就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • python引入不同文件夾下的自定義模塊方法

    python引入不同文件夾下的自定義模塊方法

    今天小編就為大家分享一篇python引入不同文件夾下的自定義模塊方法。具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-10-10
  • Python?gRPC流式通信協(xié)議詳細(xì)講解

    Python?gRPC流式通信協(xié)議詳細(xì)講解

    這篇文章主要介紹了Python?gRPC流式通信協(xié)議,最近幾天在搞golang的grpc,跑通之后想用php作為客戶(hù)端調(diào)用一下grpc服務(wù),結(jié)果拉了,一個(gè)php的grpc服務(wù)安裝,搞了好幾天,總算搞定了
    2022-11-11
  • python打包成so文件過(guò)程解析

    python打包成so文件過(guò)程解析

    這篇文章主要介紹了python打包成so文件過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-09-09
  • Python列表的索引與切片

    Python列表的索引與切片

    這篇文章主要介紹了Python列表的索引與切片,索引用來(lái)對(duì)單個(gè)成員(元素)進(jìn)行訪問(wèn),切片則是對(duì)一定范圍內(nèi)的成員(元素)進(jìn)行訪問(wèn)。下文相關(guān)自來(lái)需要的小伙伴可以參考一下
    2022-04-04
  • Python使用正則表達(dá)式實(shí)現(xiàn)文本替換的方法

    Python使用正則表達(dá)式實(shí)現(xiàn)文本替換的方法

    這篇文章主要介紹了Python使用正則表達(dá)式實(shí)現(xiàn)文本替換的方法,結(jié)合實(shí)例形式分析了Python使用正則表達(dá)式實(shí)現(xiàn)文本替換的具體操作步驟與相關(guān)使用注意事項(xiàng),需要的朋友可以參考下
    2017-04-04
  • Python中pow()和math.pow()函數(shù)用法示例

    Python中pow()和math.pow()函數(shù)用法示例

    這篇文章主要介紹了Python中pow()和math.pow()函數(shù)用法,結(jié)合具體實(shí)例形式分析了Python使用pow()和math.pow()函數(shù)進(jìn)行冪運(yùn)算的相關(guān)操作技巧,需要的朋友可以參考下
    2018-02-02
  • 基于Python編寫(xiě)一個(gè)圖片識(shí)別系統(tǒng)

    基于Python編寫(xiě)一個(gè)圖片識(shí)別系統(tǒng)

    本項(xiàng)目將使用python3去識(shí)別圖片是否為色情圖片,會(huì)使用到PIL這個(gè)圖像處理庫(kù),并且編寫(xiě)算法來(lái)劃分圖像的皮膚區(qū)域,感興趣的可以了解一下
    2022-06-06
  • python二叉樹(shù)類(lèi)以及其4種遍歷方法實(shí)例

    python二叉樹(shù)類(lèi)以及其4種遍歷方法實(shí)例

    二叉樹(shù)是一種特殊的樹(shù),最直觀地體現(xiàn)于它的每個(gè)節(jié)點(diǎn)至多有兩個(gè)子節(jié)點(diǎn),二叉樹(shù)是非常實(shí)用的一種數(shù)據(jù)結(jié)構(gòu),常常用于實(shí)現(xiàn)二叉查找樹(shù)及二叉堆等,下面這篇文章主要給大家介紹了關(guān)于python二叉樹(shù)類(lèi)以及其4種遍歷方法的相關(guān)資料,需要的朋友可以參考下
    2022-05-05
  • 實(shí)踐Python的爬蟲(chóng)框架Scrapy來(lái)抓取豆瓣電影TOP250

    實(shí)踐Python的爬蟲(chóng)框架Scrapy來(lái)抓取豆瓣電影TOP250

    這篇文章主要介紹了實(shí)踐Python的爬蟲(chóng)框架Scrapy來(lái)抓取豆瓣電影TOP250的過(guò)程,文中的環(huán)境基于Windows操作系統(tǒng),需要的朋友可以參考下
    2016-01-01
  • 使用Python實(shí)現(xiàn)將PDF轉(zhuǎn)為圖片

    使用Python實(shí)現(xiàn)將PDF轉(zhuǎn)為圖片

    這篇文章主要為大家詳細(xì)介紹了python如何借用第三方庫(kù)Spire.PDF for Python,從而實(shí)現(xiàn)將PDF轉(zhuǎn)為圖片的功能,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-10-10

最新評(píng)論