亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

使用Python計(jì)算兩個(gè)不同列表的相似度

 更新時(shí)間:2023年07月28日 08:51:33   作者:袁袁袁袁滿  
這篇文章主要介紹了使用Python計(jì)算兩個(gè)不同列表的相似度,Python數(shù)據(jù)開發(fā)工作中的需求兩個(gè)不同列表給出相似度,本文實(shí)現(xiàn)判斷數(shù)字類型相似度和字符串類型相似度,非常實(shí)用,需要的朋友可以參考下

數(shù)字類型相似度

可以使用余弦相似度來計(jì)算兩個(gè)列表的相似度。

具體步驟如下:

  1. 將兩個(gè)列表轉(zhuǎn)化為向量形式,即將列表中的元素作為向量的分量。
  2. 計(jì)算向量的點(diǎn)積。
  3. 計(jì)算向量的模長。
  4. 計(jì)算余弦值。
  5. 將余弦值作為相似度。

Python代碼實(shí)現(xiàn):

import math
def cosine_similarity(list1, list2):
    dot_product = sum([list1[i]*list2[i] for i in range(len(list1))])
    norm1 = math.sqrt(sum([x**2 for x in list1]))
    norm2 = math.sqrt(sum([x**2 for x in list2]))
    similarity = dot_product / (norm1 * norm2)
    return similarity
# 示例
list1 = [1, 2, 3, 4, 5]
list2 = [3, 4, 5, 6, 7]
similarity = cosine_similarity(list1, list2)
print(similarity)

輸出結(jié)果為:

0.9970544855015815

表示兩個(gè)列表的相似度很高。

字符串類型相似度

可以使用Jaccard相似度來計(jì)算兩個(gè)字符串列表的相似度。

Jaccard相似度是通過計(jì)算兩個(gè)集合的交集與并集之比來衡量它們的相似程度。具體步驟如下:

  1. 將兩個(gè)列表轉(zhuǎn)化為集合形式,即將列表中的元素作為集合的元素。
  2. 計(jì)算兩個(gè)集合的交集。
  3. 計(jì)算兩個(gè)集合的并集。
  4. 計(jì)算交集與并集之比。
  5. 將比值作為相似度。

Python代碼實(shí)現(xiàn):

def jaccard_similarity(list1, list2):
    set1 = set(list1)
    set2 = set(list2)
    intersection = len(set1.intersection(set2))
    union = len(set1.union(set2))
    similarity = intersection / union
    return similarity
# 示例
list1 = ['apple', 'banana', 'orange']
list2 = ['apple', 'pear', 'peach']
similarity = jaccard_similarity(list1, list2)
print(similarity)

輸出結(jié)果為:

0.25

表示兩個(gè)字符串列表的相似度較低。

到此這篇關(guān)于使用Python計(jì)算兩個(gè)不同列表的相似度的文章就介紹到這了,更多相關(guān)Python計(jì)算列表相似度內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • jupyter的安裝與使用以及運(yùn)行卡頓問題及解決

    jupyter的安裝與使用以及運(yùn)行卡頓問題及解決

    這篇文章主要介紹了jupyter的安裝與使用以及運(yùn)行卡頓問題及解決,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-06-06
  • pytest自定義命令行參數(shù)的實(shí)現(xiàn)

    pytest自定義命令行參數(shù)的實(shí)現(xiàn)

    本文主要介紹了在使用pytest運(yùn)行測試用例時(shí),通過傳遞自定義命令行參數(shù)來啟動(dòng)mitmdump進(jìn)程進(jìn)行抓包,具有一定的參考價(jià)值,感興趣的可以了解一下
    2024-12-12
  • 獲取CSDN文章內(nèi)容并轉(zhuǎn)換為markdown文本的python

    獲取CSDN文章內(nèi)容并轉(zhuǎn)換為markdown文本的python

    這篇文章主要介紹了自己寫的小工具,可以直接獲取csdn文章并轉(zhuǎn)換為markdown格式,需要的朋友可以參考下
    2020-09-09
  • python 實(shí)現(xiàn)的車牌識(shí)別項(xiàng)目

    python 實(shí)現(xiàn)的車牌識(shí)別項(xiàng)目

    這篇文章主要介紹了python 實(shí)現(xiàn)的車牌識(shí)別項(xiàng)目,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2021-01-01
  • Python?GUI實(shí)現(xiàn)PDF轉(zhuǎn)Word功能

    Python?GUI實(shí)現(xiàn)PDF轉(zhuǎn)Word功能

    這篇文章主要介紹了如何使用?wxPython?創(chuàng)建一個(gè)簡單的圖形用戶界面(GUI)應(yīng)用程序,結(jié)合?pdf2docx?庫,實(shí)現(xiàn)將?PDF?轉(zhuǎn)換為?Word?文檔的功能,需要的可以參考下
    2024-12-12
  • 使用wxPython和ECharts實(shí)現(xiàn)生成和保存HTML圖表

    使用wxPython和ECharts實(shí)現(xiàn)生成和保存HTML圖表

    wxPython是一個(gè)基于wxWidgets的Python?GUI庫,ECharts是一個(gè)用于數(shù)據(jù)可視化的JavaScript庫,本文主要為大家介紹了如何使用wxPython和ECharts庫來生成和保存HTML圖表,感興趣的可以學(xué)習(xí)一下
    2023-08-08
  • python列表的特點(diǎn)分析

    python列表的特點(diǎn)分析

    在本篇文章里小編個(gè)大家整理的是一篇關(guān)于python列表的特點(diǎn)分析內(nèi)容總結(jié),有需要的朋友們可以學(xué)習(xí)下。
    2021-08-08
  • Python tornado上傳文件的功能

    Python tornado上傳文件的功能

    這篇文章主要介紹了Python tornado上傳文件的功能,代碼分為普通上傳和ajax上傳,通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-03-03
  • 基于Python實(shí)現(xiàn)身份證信息識(shí)別功能

    基于Python實(shí)現(xiàn)身份證信息識(shí)別功能

    身份證是用于證明個(gè)人身份和身份信息的官方證件,在現(xiàn)代社會(huì)中,身份證被廣泛應(yīng)用于各種場景,如就業(yè)、教育、醫(yī)療、金融等,它包含了個(gè)人的基本信息,本文給大家介紹了如何基于Python實(shí)現(xiàn)身份證信息識(shí)別功能,感興趣的朋友可以參考下
    2024-01-01
  • 關(guān)于numpy中np.nonzero()函數(shù)用法的詳解

    關(guān)于numpy中np.nonzero()函數(shù)用法的詳解

    下面小編就為大家?guī)硪黄P(guān)于numpy中np.nonzero()函數(shù)用法的詳解。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-02-02

最新評(píng)論