亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

JavaScript實(shí)現(xiàn)文本相似度對(duì)比

 更新時(shí)間:2022年06月02日 11:46:03   作者:??三苗同學(xué)????  
這篇文章主要介紹了JavaScript實(shí)現(xiàn)文本相似度對(duì)比,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下

一、發(fā)現(xiàn)問題

在開發(fā)過程中,難免會(huì)使用到2個(gè)(多個(gè))文本內(nèi)容處理,一是便于宏觀知道文本的重合度,而是更好的區(qū)分文本的創(chuàng)新度,也能更好的避免出現(xiàn)大篇幅復(fù)制。

為此,可以通過2個(gè)文本的相似度對(duì)比來實(shí)現(xiàn)業(yè)務(wù)需求。

二、解決問題

如果使用后端語言1來處理,就需要調(diào)取接口,對(duì)比少量的短文本可以實(shí)現(xiàn),但是一旦遇到在界面實(shí)現(xiàn)多個(gè)文本對(duì)比,并且篇幅巨多,再通過接口可能就出現(xiàn)耗時(shí)特別長(zhǎng)的情況。既然如此,但不如直接使用前端來處理。

使用算法:編輯距離。

1、編輯距離的概念

設(shè)A和B是兩個(gè)字符串,使用最少的字符操作將字符串A轉(zhuǎn)換為B。字符操作包括:(1)刪除一個(gè)字符;(2)插入一個(gè)字符;(3)將一個(gè)字符改寫為另一個(gè)字符。將字符串A變換為字符串B所需要的最少字符操作數(shù)稱為字符串A到字符串B的編輯距離(Edit Distance)

2、測(cè)試文本

舉例,文字來自網(wǎng)絡(luò)。

文本1

北京商報(bào)訊(記者 魏蔚)1月21日,交通運(yùn)輸部官方微信公眾號(hào)披露,1月20日上午,交通運(yùn)輸新業(yè)態(tài)協(xié)同監(jiān)管部際聯(lián)席會(huì)議辦公室對(duì)滿幫、貨拉拉、滴滴貨運(yùn)、快狗打車等4家互聯(lián)網(wǎng)道路貨運(yùn)平臺(tái)公司進(jìn)行約談,對(duì)滴滴出行、曹操出行、T3出行、美團(tuán)出行等4家網(wǎng)約車平臺(tái)公司進(jìn)行提醒。

文本2

智通財(cái)經(jīng)APP獲悉,1月20日,交通運(yùn)輸新業(yè)態(tài)協(xié)同監(jiān)管部際聯(lián)席會(huì)議辦公室對(duì)滿幫、貨拉拉、滴滴貨運(yùn)、快狗打車等4家互聯(lián)網(wǎng)道路貨運(yùn)平臺(tái)公司進(jìn)行約談,對(duì)滴滴出行、曹操出行、T3出行、美團(tuán)出行等4家網(wǎng)約車平臺(tái)公司進(jìn)行提醒。

3、代碼實(shí)現(xiàn)

實(shí)現(xiàn)代碼如下,最后返回的數(shù)據(jù)邏輯可以自行修改。

/**
 * 相似度對(duì)比
 * @param s 文本1
 * @param t 文本2
 * @param f 小數(shù)位精確度,默認(rèn)2位
 * @returns {string|number|*} 百分?jǐn)?shù)前的數(shù)值,最大100. 比如 :90.32
 */
function similar(s, t, f) {
  if (!s || !t) {
    return 0
  }
  if(s === t){
    return 100;
  }
  var l = s.length > t.length ? s.length : t.length
  var n = s.length
  var m = t.length
  var d = []
  f = f || 2
  var min = function (a, b, c) {
    return a < b ? (a < c ? a : c) : (b < c ? b : c)
  }
  var i, j, si, tj, cost
  if (n === 0) return m
  if (m === 0) return n
  for (i = 0; i <= n; i++) {
    d[i] = []
    d[i][0] = i
  }
  for (j = 0; j <= m; j++) {
    d[0][j] = j
  }
  for (i = 1; i <= n; i++) {
    si = s.charAt(i - 1)
    for (j = 1; j <= m; j++) {
      tj = t.charAt(j - 1)
      if (si === tj) {
        cost = 0
      } else {
        cost = 1
      }
      d[i][j] = min(d[i - 1][j] + 1, d[i][j - 1] + 1, d[i - 1][j - 1] + cost)
    }
  }
  let res = (1 - d[n][m] / l) *100
  return res.toFixed(f)
}

4、相似度對(duì)比結(jié)果

根據(jù)測(cè)試文本對(duì)比,結(jié)果為:

75.00

到此這篇關(guān)于JavaScript實(shí)現(xiàn)文本相似度對(duì)比的文章就介紹到這了,更多相關(guān)js文本相似度內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論