python?字符串模糊匹配Fuzzywuzzy的實現(xiàn)
更新時間:2022年07月25日 09:25:05 作者:火星人火星文
本文主要介紹了python?字符串模糊匹配Fuzzywuzzy的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
Python提供fuzzywuzzy模塊,不僅可用于計算兩個字符串之間的相似度,而且還提供排序接口能從大量候選集中找到最相似的句子。
(1)安裝
pip install fuzzywuzzy
(2)接口說明
兩個模塊:fuzz, process,fuzz主要用于兩字符串之間匹配,process主要用于搜索排序。
- fuzz.ratio(s1,s2)直接計算s1和s2之間的相似度,返回值為0-100,100表示完全相同;
- fuzz.partial_ratio(S1,S2)部分匹配,如果S1是S2的子串依然返回100;
- fuzz.token_sort_ratio(S1,S2)只比較S1,S2單詞是否相同,不考慮詞語之間的順序;
- fuzz.token_set_ratio(S1,S2)相比fuzz.token_sort_ratio不考慮詞語出現(xiàn)的次數(shù);
- process.extract(S1, ListS,limit=n),表示從列表ListS中找出Top n與S1最相似的句子;
- process.extractOne(S1,ListS),返回最相似的一個
(3)使用
from fuzzywuzzy import fuzz a = 'a b c' b = ' a c b ' c = 'a c' fuzz.ratio(a, c) ? ? >> 75 fuzz.ratio(b, c) ?? ?>> 60 ?? ? fuzz.partial_ratio(a, c) ?? ?>> 67 fuzz.partial_ratio(b, c) ?? ?>> 100?? ? ?? ? fuzz.token_sort_ratio(a, c) ?? ?>> 75 fuzz.token_sort_ratio(b, c) ?? ?>> 75?? ? fuzz.token_set_ratio(a, c) ?? ?>> 100 fuzz.token_set_ratio(b, c) ?? ?>> 100
到此這篇關于python 字符串模糊匹配Fuzzywuzzy的實現(xiàn)的文章就介紹到這了,更多相關python 字符串模糊匹配內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
科學計算與數(shù)據分析利器Python數(shù)據分析庫Scipy使用詳解
Scipy在現(xiàn)代科學研究和數(shù)據分析中是一個不可或缺的庫,它建立在NumPy的基礎上,提供了更多的高級科學計算功能,包括優(yōu)化、信號處理、統(tǒng)計分析、插值、線性代數(shù)等,本文將會學習Scipy庫的各種功能和用法,包括數(shù)學優(yōu)化、統(tǒng)計分析、信號處理和插值等方面2023-11-11python代碼實現(xiàn)學生信息管理系統(tǒng)
這篇文章主要為大家詳細介紹了python代碼實現(xiàn)學生信息管理系統(tǒng),文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-05-05Python正則表達式?r'(.*)?are?(.*?)?.*'的深入理解
日常的開發(fā)工作中經常會有處理字符串的需求,簡單的字符串處理,我們使用python內置的字符串處理函數(shù)就可以了,但是復雜的字符串匹配就需要借助正則表達式了,這篇文章主要給大家介紹了關于Python正則表達式?r‘(.*)?are?(.*?)?.*‘的相關資料,需要的朋友可以參考下2022-07-07