亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python輕松過(guò)濾處理臟話與特殊敏感詞匯

 更新時(shí)間:2022年07月26日 10:11:57   作者:Python 集中營(yíng)  
我們開發(fā)的系統(tǒng)往往都離不開信息的處理,這些信息有的內(nèi)容非常敏感,就需要過(guò)濾掉不容許出現(xiàn),

python的其中一個(gè)強(qiáng)大之處就是它可以方便的集成很多的非標(biāo)準(zhǔn)庫(kù),今天在GitHub上溜達(dá)又發(fā)現(xiàn)了一個(gè)臟話處理神器,導(dǎo)入better_profanity庫(kù)后,只需要幾行代碼就能搞定了,相當(dāng)nice!

使用pip的方式將better_profanity非標(biāo)準(zhǔn)庫(kù)安裝好,這個(gè)庫(kù)好像在清華大學(xué)的鏡像站中沒(méi)有,其他鏡像站不知道有沒(méi)有,于是下載時(shí)沒(méi)有使用鏡像站,默認(rèn)到官方去下載即可。

pip install better_profanity
# 將處理模塊直接導(dǎo)入到代碼塊中
from better_profanity import profanity

1、默認(rèn)臟話庫(kù)/敏感詞庫(kù)處理

默認(rèn)情況下就只能處理英文的臟話。

censored_text = profanity.censor("you are bitch")
print(censored_text)
# you are ****

可以看到其中bitch字符被認(rèn)為是臟話已經(jīng)處理成****字符了。

當(dāng)然,還可以將處理后的臟話字符換成別的字符代替,比如下面這樣處理。

censored_text = profanity.censor("you are bitch",'-')
print(censored_text)
# you are ----

這樣****就被替換成了----。

2、自定義過(guò)濾信息處理

bad_words = ['Python', 'Java', 'Scala']  # 自定義過(guò)濾詞匯
profanity.load_censor_words(bad_words)  # 加載自定義過(guò)濾詞匯
censored_text = profanity.censor("Python is very Good !")  # 執(zhí)行過(guò)濾
print(censored_text)
# **** is very Good !

可以發(fā)現(xiàn),想要過(guò)濾的python字符已經(jīng)成功過(guò)濾掉了。

3、contains_profanity函數(shù)

contains_profanity函數(shù)用來(lái)查看我們的語(yǔ)句中是否包含需要過(guò)濾的詞匯,如果包含則會(huì)返回True,否則返回False。

bad_words = ['bitch', 'Java', 'Scala']  # 自定義過(guò)濾詞匯
profanity.load_censor_words(bad_words)  # 加載自定義過(guò)濾詞匯
censored_text = profanity.contains_profanity("you are bitch")
print(censored_text)
# True

結(jié)果為True,表示包含需要過(guò)濾的詞匯信息。

4、load_censor_words_from_file函數(shù)

load_censor_words_from_file函數(shù)用于加載需要過(guò)濾詞匯的文件。

profanity.load_censor_words_from_file('/usr/load/bad_words.txt')

加載完詞匯文件之后,按照之前的邏輯處理即可。

詞匯文件的定義格式,按照每個(gè)詞匯獨(dú)占一行的形式進(jìn)行定義,文件格式使用.txt文本文檔即可。

# bitch
# bitches
# bitchin
# bitching
# blowjob
# blowjobs
# blue waffle

到此這篇關(guān)于python輕松過(guò)濾處理臟話與特殊敏感詞匯的文章就介紹到這了,更多相關(guān)python臟話處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論