亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

如何利用Python實現(xiàn)一個論文降重工具

 更新時間:2021年07月09日 11:51:33   作者:librauee  
文章去重(或叫網(wǎng)頁去重)是根據(jù)文章(或網(wǎng)頁)的文字內容來判斷多個文章之間是否重復,下面這篇文章主要給大家介紹了關于利用Python實現(xiàn)論文降重工具的相關資料,需要的朋友可以參考下

前言

時值畢業(yè)季,有不少小伙伴深受論文查重的困擾。因此我便想到做一個簡單的自動去重的工具,先看看效果,我們再對原理或是代碼實現(xiàn)做進一步的分析。

首先需要輸入appid以及key,這些可以在百度翻譯開放平臺申請一個賬號,可以免費申請一個賬號。接著將需要進行降重的文本內容復制到相應的輸入框內,點擊開始按鈕,即可輸出不同但意思相近的語句,即達到降重去重的作用。點擊復制按鈕便可以將得到的新文本復制到剪貼板上,點擊清楚按鈕可以重新輸入需要降重的文本,并且循環(huán)往復地進行。

去重原理

論文查重的粒度是句子,兩個句子的相似度主要取決于句子包含哪些詞,以及詞在句子中的位置。句子相似度只是文字上的對比,不考慮語義上的相近。

正因如此,我們可以采取的措施便是變換句子結構,使用近似詞替換。

為了完成這些句子的自動替換,從而達到降重的目的,這里很容易便想到利用不同語種之間的互相轉換來生成新文本。比如在本工具中,我采用了中文→英文→韓文→中文的策略,你也可以采取更長的轉換路徑,但那樣似乎會在很大程度上降低文本的可讀性。

開放平臺的使用

語句的翻譯我采用了百度翻譯開放平臺的接口,簡單地申請之后就可以獲取每個月200萬的免費字符翻譯權限。

此API的接入方式略微有些麻煩,需要生成簽名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

總結

在弄清楚原理以及API的調用方法之后,我們可以輕松地寫出一個GUI界面,也就是這個降重工具。當然這個工具非常初級,大家可以進行更加全面的擴展。

到此這篇關于如何利用Python實現(xiàn)一個論文降重工具的文章就介紹到這了,更多相關Python論文降重工具內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • python學習基礎之循環(huán)import及import過程

    python學習基礎之循環(huán)import及import過程

    python中的import語句是用來導入模塊的,下面這篇文章主要給大家介紹了關于python學習基礎之循環(huán)import及import過程的相關資料,需要的朋友可以參考借鑒,下面隨著小編來一起學習學習吧。
    2018-04-04
  • OpenCV特征提取與檢測之Harris角點檢測

    OpenCV特征提取與檢測之Harris角點檢測

    這篇文章主要給大家介紹了關于OpenCV特征提取與檢測之Harris角點檢測的相關資料,Harris角點檢測的目的是去分辨出圖像中的平面、邊界以及角點,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考下
    2021-08-08
  • Python中pygal繪制雷達圖代碼分享

    Python中pygal繪制雷達圖代碼分享

    這篇文章主要介紹了Python中pygal繪制雷達圖代碼分享,具有一定借鑒價值,需要的朋友可以參考下。
    2017-12-12
  • python學生信息管理系統(tǒng)實現(xiàn)代碼

    python學生信息管理系統(tǒng)實現(xiàn)代碼

    這篇文章主要為大家詳細介紹了python學生信息管理系統(tǒng)的實現(xiàn)代碼,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2021-06-06
  • python簡單幾步獲取各種DOS命令顯示的內容詳解流程

    python簡單幾步獲取各種DOS命令顯示的內容詳解流程

    你會用python獲取各種DOS命令顯示的內容核心嗎?說的可不是返回值,是用system()函數(shù)調用windows操作系統(tǒng)的DOS命令來做點事情,需要的朋友可以參考下
    2021-10-10
  • 利用django如何解析用戶上傳的excel文件

    利用django如何解析用戶上傳的excel文件

    這篇文章主要給大家介紹了關于利用django如何解析用戶上傳的excel文件的相關資料,這是最近在工作中遇到的一個問題,覺著有必要分享出給大家,需要的朋友可以參考借鑒,下面來一起看看詳細的介紹吧。
    2017-07-07
  • 解決keras,val_categorical_accuracy:,0.0000e+00問題

    解決keras,val_categorical_accuracy:,0.0000e+00問題

    這篇文章主要介紹了解決keras,val_categorical_accuracy:,0.0000e+00問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-07-07
  • Python中的基本數(shù)據(jù)類型介紹

    Python中的基本數(shù)據(jù)類型介紹

    這篇文章介紹了Python中的基本數(shù)據(jù)類型,文中通過示例代碼介紹的非常詳細。對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-07-07
  • python輸出100以內的質數(shù)與合數(shù)實例代碼

    python輸出100以內的質數(shù)與合數(shù)實例代碼

    本文通過實例代碼給大家介紹了python輸出100以內的質數(shù)與合數(shù)的方法,非常不錯,具有一定的參考借鑒價值,需要的朋友參考下吧
    2018-07-07
  • Python解析Laravel?Cookie技巧示例

    Python解析Laravel?Cookie技巧示例

    本文將介紹如何使用Python解析Laravel Cookie,以便在Web開發(fā)中處理這些Cookie數(shù)據(jù),我們將深入了解Cookie的結構,以及如何在Python中對其進行解析和操作
    2023-12-12

最新評論