Python 讀取某個目錄下所有的文件實例
更新時間:2018年06月23日 15:12:16 作者:嘎里給給
今天小編就為大家分享一篇Python 讀取某個目錄下所有的文件實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
在處理數(shù)據(jù)的時候,因為沒有及時的去重,所以需要重新對生成txt進行去重。
可是一個文件夾下有很多txt,總不可能一個一個去操作,這樣效率太低了。這里我們需要用到 os 這個包
關鍵的代碼
<span style="font-size:14px;"># coding=utf-8 #出現(xiàn)了中文亂碼的問題,于是我無腦utf-8 。希望后期的學習可以能理解 import os import os.path import re import sys import codecs reload(sys) sys.setdefaultencoding('utf-8') #這里放著你要操作的文件夾名稱 path = 'E:\\get_key\\' #把e:\get_key\目錄下的文件名全部獲取保存在files中 files = os.listdir(path.decode('utf-8')) #用set可以很好的去重,在數(shù)據(jù)處理的時候經(jīng)常會被使用到。這里做初始化 datas = set() for file in files : #準確獲取一個txt的位置,利用字符串的拼接 txt_path = 'E:\\get_key\\'+file.decode('utf-8') #把結果保存了在contents中 contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8') #datas的數(shù)據(jù)清空 datas.clear() #把數(shù)據(jù)add到datas中,可以去重 for content in contents: print(content.decode('utf-8')) datas.add(content.decode('utf-8')) #去重后新的文件保存的路徑 new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8') unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8') #把datas里的數(shù)據(jù)輸出到新生成的txt中 for data in datas: unique_keywords.write(data+"\n") #釋放資源 unique_keywords.close()</span>
以上這篇Python 讀取某個目錄下所有的文件實例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python面向對象程序設計構造函數(shù)和析構函數(shù)用法分析
這篇文章主要介紹了Python面向對象程序設計構造函數(shù)和析構函數(shù)用法,結合具體實例形式分析了Python面向對象程序設計中構造函數(shù)與析構函數(shù)的概念、原理、功能及相關使用技巧,需要的朋友可以參考下2019-04-04matlab輸出數(shù)據(jù)為excel文件的問題
這篇文章主要介紹了matlab輸出數(shù)據(jù)為excel文件的問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08Jupyter notebook如何實現(xiàn)打開數(shù)據(jù)集
這篇文章主要介紹了Jupyter notebook如何實現(xiàn)打開數(shù)據(jù)集問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-01-01Python使用post及get方式提交數(shù)據(jù)的實例
今天小編就為大家分享一篇關于Python使用post及get方式提交數(shù)據(jù)的實例,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2019-01-01