Python 求向量的余弦值操作
1、余弦相似度
余弦相似度衡量的是2個(gè)向量間的夾角大小,通過夾角的余弦值表示結(jié)果,因此2個(gè)向量的余弦相似度為:
余弦相似度的取值為[-1,1],值越大表示越相似。
向量夾角的余弦公式很簡(jiǎn)單,不在此贅述,直接上代碼:
def cosVector(x,y): if(len(x)!=len(y)): print('error input,x and y is not in the same space') return; result1=0.0; result2=0.0; result3=0.0; for i in range(len(x)): result1+=x[i]*y[i] #sum(X*Y) result2+=x[i]**2 #sum(X*X) result3+=y[i]**2 #sum(Y*Y) #print(result1) #print(result2) #print(result3) print("result is "+str(result1/((result2*result3)**0.5))) #結(jié)果顯示 cosVector([2,1],[1,1])
一個(gè)計(jì)算二維數(shù)組余弦值的例子:
#求余弦函數(shù) def cosVector(x,y): if(len(x)!=len(y)): print('error input,x and y is not in the same space') return; result1=0.0; result2=0.0; result3=0.0; for i in range(len(x)): result1+=x[i]*y[i] #sum(X*Y) result2+=x[i]**2 #sum(X*X) result3+=y[i]**2 #sum(Y*Y) #print("result is "+str(result1/((result2*result3)**0.5))) #結(jié)果顯示 return result1/((result2*result3)**0.5) #print("result is ",cosVector([2,1],[1,1])) #計(jì)算query_output(60,20)和db_output(60,20)的余弦值,用60*1的向量存儲(chǔ) cosResult= [[0]*1 for i in range(60)] for i in range(60): cosResult[i][0]=cosVector(query_output[i], db_output[i]) print(cosResult) -------------------------------------------------------------------------------------------- #計(jì)算query_output和db_output的余弦值,用60*1的向量存儲(chǔ) rows=query_output.shape[0] #行數(shù) cols=query_output.shape[1] #列數(shù) cosResult= [[0]*1 for i in range(rows)] for i in range(rows): cosResult[i][0]=cosVector(query_output[i], db_output[i]) #print(cosResult) #將結(jié)果存入文件中,并且一行一個(gè)數(shù)字 file=open('cosResult.txt','w') for i in cosResult: file.write(str(i).replace('[','').replace(']','')+'\n') #\r\n為換行符 file.close()
補(bǔ)充:python實(shí)現(xiàn)余弦近似度
方法一:
def cos(vector1,vector2): dot_product = 0.0 normA = 0.0 normB = 0.0 for a,b in zip(vector1,vector2): dot_product += a*b normA += a**2 normB += b**2 if normA == 0.0 or normB==0.0: return None else: return 0.5 + 0.5 * dot_product / ((normA*normB)**0.5) #歸一化 <span style="font-family: Arial, Helvetica, sans-serif;">從[-1,1]到[0,1]</span>
方法二:
num = float(A.T * B) #若為行向量則 A * B.T denom = linalg.norm(A) * linalg.norm(B) cos = num / denom #余弦值 sim = 0.5 + 0.5 * cos #歸一化 從[-1,1]到[0,1]
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
詳解Django+Uwsgi+Nginx 實(shí)現(xiàn)生產(chǎn)環(huán)境部署
這篇文章主要介紹了詳解Django+Uwsgi+Nginx 實(shí)現(xiàn)生產(chǎn)環(huán)境部署,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-11-11Python實(shí)現(xiàn)在Excel文件中寫入圖表
這篇文章主要為大家介紹了如何利用Python語言實(shí)現(xiàn)在Excel文件中寫入一個(gè)比較簡(jiǎn)單的圖表,文中的實(shí)現(xiàn)方法講解詳細(xì),快動(dòng)手嘗試一下吧2022-05-05python3的數(shù)據(jù)類型及數(shù)據(jù)類型轉(zhuǎn)換實(shí)例詳解
在本文里小編給大家分享的是關(guān)于python3的數(shù)據(jù)類型及數(shù)據(jù)類型轉(zhuǎn)換以及相關(guān)實(shí)例內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。2019-08-08Python獲取統(tǒng)計(jì)自己的qq群成員信息的方法
這篇文章主要介紹了Python獲取統(tǒng)計(jì)自己的qq群成員信息的方法,本文分步驟給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-11-11python中zip和unzip數(shù)據(jù)的方法
這篇文章主要介紹了python中zip和unzip數(shù)據(jù)的方法,實(shí)例分析了Python中zlib模塊的相關(guān)使用技巧,需要的朋友可以參考下2015-05-05利用Python找出刪除自己微信的好友并將他們自動(dòng)化刪除
你是否有微信被刪了好友不自知,還傻傻的給對(duì)方發(fā)消息,結(jié)果出現(xiàn)了下圖中那尷尬的一幕的經(jīng)歷呢?其實(shí)我們可以用Python提前把他們找出來并自動(dòng)化刪除避免尷尬的2023-01-01基于Python檢測(cè)動(dòng)態(tài)物體顏色過程解析
這篇文章主要介紹了基于Python檢測(cè)動(dòng)態(tài)物體顏色過程解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-12-12