python去除文件中重復的行實例
python去除文件中重復的行,我們可以設(shè)置一個一個空list,res_list,用來加入沒有出現(xiàn)過的字符行!
如果出現(xiàn)在res_list,我們就認為該行句子已經(jīng)重復了,可以再加入到記錄重復句子的list中。
如下代碼:
# -*- coding: UTF-8 -*- #程序功能是為了完成判斷文件中是否有重復句子 #并將重復句子打印出來 res_list = [] #f = open('F:/master/master-work/code_of_graduate/LTP_data/raw_plain.txt','r') f = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-res.txt','r') res_dup = [] index = 0 file_dul = open('F:/master/master-work/code_of_graduate/chu_li_shuju/ldc-weibo-train-dul.txt', 'w') for line in f.readlines(): index = index + 1 if line in res_list: temp_str = "" temp_str = temp_str + str(index) #要變?yōu)閟tr才行 temp_line = ''.join(line) temp_str = temp_str+temp_line #最終要變?yōu)閟tr類型 file_dul.write(temp_str); #將重復的存入到文件中 else: res_list.append(line)
以上這篇python去除文件中重復的行實例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
基于python OpenCV實現(xiàn)動態(tài)人臉檢測
這篇文章主要為大家詳細介紹了基于python OpenCV實現(xiàn)動態(tài)人臉檢測,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-05-05Python3 jupyter notebook 服務(wù)器搭建過程
這篇文章主要介紹了Python3 jupyter notebook 服務(wù)器搭建過程,非常不錯,具有一定的參考借鑒價值,需要的朋友參考下吧2018-11-11最簡化ChatGLM2-6b小白部署教程【windows系統(tǒng),16G內(nèi)存即可,對顯卡無要求,CPU運行】
這篇文章主要介紹了最簡化ChatGLM2-6b小白部署的方法,可以在windows系統(tǒng)環(huán)境下,16G內(nèi)存且對顯卡無要求,并以CPU模式運行,方便實現(xiàn)個人PC機環(huán)境下的部署體驗,需要的朋友可以參考下2023-07-07Python實現(xiàn)登錄人人網(wǎng)并抓取新鮮事的方法
這篇文章主要介紹了Python實現(xiàn)登錄人人網(wǎng)并抓取新鮮事的方法,可實現(xiàn)Python模擬登陸并抓取新鮮事的功能,需要的朋友可以參考下2015-05-05python實現(xiàn)csdn全部博文下載并轉(zhuǎn)PDF
我們學習編程,在學習的時候,會有想把有用的知識點保存下來,我們可以把知識點的內(nèi)容爬下來轉(zhuǎn)變成pdf格式,方便我們拿手機可以閑時翻看,是很方便的,本文就介紹一下如何實現(xiàn)2021-06-06python+selenium開發(fā)環(huán)境搭建圖文教程
這篇文章主要為大家詳細介紹了python+selenium開發(fā)環(huán)境搭建的圖文教程,具有一定的參考價值,感興趣的小伙伴們可以參考一下2017-08-08