python輕松過(guò)濾處理臟話與特殊敏感詞匯
python的其中一個(gè)強(qiáng)大之處就是它可以方便的集成很多的非標(biāo)準(zhǔn)庫(kù),今天在GitHub上溜達(dá)又發(fā)現(xiàn)了一個(gè)臟話處理神器,導(dǎo)入better_profanity庫(kù)后,只需要幾行代碼就能搞定了,相當(dāng)nice!
使用pip的方式將better_profanity非標(biāo)準(zhǔn)庫(kù)安裝好,這個(gè)庫(kù)好像在清華大學(xué)的鏡像站中沒(méi)有,其他鏡像站不知道有沒(méi)有,于是下載時(shí)沒(méi)有使用鏡像站,默認(rèn)到官方去下載即可。
pip install better_profanity # 將處理模塊直接導(dǎo)入到代碼塊中 from better_profanity import profanity
1、默認(rèn)臟話庫(kù)/敏感詞庫(kù)處理
默認(rèn)情況下就只能處理英文的臟話。
censored_text = profanity.censor("you are bitch") print(censored_text) # you are ****
可以看到其中bitch字符被認(rèn)為是臟話已經(jīng)處理成****字符了。
當(dāng)然,還可以將處理后的臟話字符換成別的字符代替,比如下面這樣處理。
censored_text = profanity.censor("you are bitch",'-') print(censored_text) # you are ----
這樣****就被替換成了----。
2、自定義過(guò)濾信息處理
bad_words = ['Python', 'Java', 'Scala'] # 自定義過(guò)濾詞匯 profanity.load_censor_words(bad_words) # 加載自定義過(guò)濾詞匯 censored_text = profanity.censor("Python is very Good !") # 執(zhí)行過(guò)濾 print(censored_text) # **** is very Good !
可以發(fā)現(xiàn),想要過(guò)濾的python字符已經(jīng)成功過(guò)濾掉了。
3、contains_profanity函數(shù)
contains_profanity函數(shù)用來(lái)查看我們的語(yǔ)句中是否包含需要過(guò)濾的詞匯,如果包含則會(huì)返回True,否則返回False。
bad_words = ['bitch', 'Java', 'Scala'] # 自定義過(guò)濾詞匯 profanity.load_censor_words(bad_words) # 加載自定義過(guò)濾詞匯 censored_text = profanity.contains_profanity("you are bitch") print(censored_text) # True
結(jié)果為True,表示包含需要過(guò)濾的詞匯信息。
4、load_censor_words_from_file函數(shù)
load_censor_words_from_file函數(shù)用于加載需要過(guò)濾詞匯的文件。
profanity.load_censor_words_from_file('/usr/load/bad_words.txt')
加載完詞匯文件之后,按照之前的邏輯處理即可。
詞匯文件的定義格式,按照每個(gè)詞匯獨(dú)占一行的形式進(jìn)行定義,文件格式使用.txt文本文檔即可。
# bitch
# bitches
# bitchin
# bitching
# blowjob
# blowjobs
# blue waffle
到此這篇關(guān)于python輕松過(guò)濾處理臟話與特殊敏感詞匯的文章就介紹到這了,更多相關(guān)python臟話處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python標(biāo)準(zhǔn)庫(kù)pickle的簡(jiǎn)單使用
本文主要介紹了Python標(biāo)準(zhǔn)庫(kù)pickle的簡(jiǎn)單使用,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-05-05詳解K-means算法在Python中的實(shí)現(xiàn)
這篇文章主要介紹了詳解K-means算法在Python中的實(shí)現(xiàn),具有一定借鑒價(jià)值,需要的朋友可以了解下。2017-12-12在python 中實(shí)現(xiàn)運(yùn)行多條shell命令
今天小編就為大家分享一篇在python 中實(shí)現(xiàn)運(yùn)行多條shell命令,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01Pygame游戲開發(fā)之太空射擊實(shí)戰(zhàn)敵人精靈篇
相信大多數(shù)8090后都玩過(guò)太空射擊游戲,在過(guò)去游戲不多的年代太空射擊自然屬于經(jīng)典好玩的一款了,今天我們來(lái)自己動(dòng)手實(shí)現(xiàn)它,在編寫學(xué)習(xí)中回顧過(guò)往展望未來(lái),下面開始講解敵人精靈的使用2022-08-08python區(qū)塊鏈簡(jiǎn)易版交易完善挖礦獎(jiǎng)勵(lì)示例
這篇文章主要介紹了python區(qū)塊鏈簡(jiǎn)易版交易完善挖礦獎(jiǎng)勵(lì)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05python在windows下創(chuàng)建隱藏窗口子進(jìn)程的方法
這篇文章主要介紹了python在windows下創(chuàng)建隱藏窗口子進(jìn)程的方法,涉及Python使用subprocess模塊操作進(jìn)程的相關(guān)技巧,需要的朋友可以參考下2015-06-06PHP基于phpqrcode類庫(kù)生成二維碼過(guò)程解析
這篇文章主要介紹了PHP基于phpqrcode類庫(kù)生成二維碼過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-05-05Python機(jī)器學(xué)習(xí)入門(三)之Python數(shù)據(jù)準(zhǔn)備
這篇文章主要介紹了Python機(jī)器學(xué)習(xí)入門知識(shí),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-08-08