python 文件查找及內(nèi)容匹配方法
需求:程序開發(fā)中有大量的接口,但在實(shí)際的使用中有一部分是沒有使用的,在開發(fā)的程序中匹配這些接口名,找到哪些接口從沒有使用過。將這些沒有使用過的接口名保存下來。
代碼結(jié)構(gòu):
結(jié)構(gòu)解析:
1、find.py 是文件查找及匹配程序
2、input_files.txt是待匹配內(nèi)容
文件格式如下:
3、result.txt 用于存放查找結(jié)果
格式同上
4、text.txt 用于測試的文檔(可忽略)
實(shí)際代碼:
find.py
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import os, re, datetime
class Find(object):
def __init__(self, root, input_file):
"""
--初始化
"""
self.root = root # 文件樹的根
self.input_files = [] # 待查詢的字符串集合
self.files = [] # 待匹配的文件集合
self.current = 0 # 正在匹配的文件集合的位置
f = file(input_file, "r")
old_content = f.read()
f.close()
self.input_files = old_content.split('\n') # 將待匹配字符串保存在數(shù)組中
@staticmethod
def find_file(self):
"""
--查找文件,即遍歷文件樹將查找到的文件放在文件集合中
:return:
"""
# python中的walk方法可以查找到所給路徑下的所有文件和文件夾,這里只用文件
for root, dirs, files in os.walk(self.root, topdown=True):
for name in files:
self.files.append(os.path.join(root, name))
# print(os.path.join(root, name))
# for name in dirs:
# print(os.path.join(root, name))
@staticmethod
def walk(self):
"""
--逐一查找,并將結(jié)果存入result.txt文件中
:param self:
:return:
"""
for item1 in self.files:
Find.traverse_file(self, item1)
try:
result = ''
for item3 in self.input_files:
result += item3 + '\n'
f = file("./result_files.txt", "w")
f.write(result)
f.close()
except IOError, msg:
print "Error:", msg
else:
print "OK"
@staticmethod
def traverse_file(self, file_path):
"""
--遍歷文件,匹配字符串
:return:
"""
f = file(file_path, "r")
file_content = f.read()
f.close()
input_files = []
for item2 in self.input_files:
if item2:
# 正則匹配,不區(qū)分大小寫
searchObj = re.search(r'(.*)' + item2 + '.*', file_content, re.M | re.I)
if searchObj:
continue
else:
input_files.append(item2)
self.input_files = input_files
if __name__ == "__main__":
print datetime.datetime.now()
findObj = Find('F:\\projects', "./input_files.txt")
findObj.find_file(findObj)
findObj.walk(findObj)
print datetime.datetime.now()
以上這篇python 文件查找及內(nèi)容匹配方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python3 把一個(gè)列表按指定數(shù)目分成多個(gè)列表的方式
今天小編就為大家分享一篇Python3 把一個(gè)列表按指定數(shù)目分成多個(gè)列表的方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-12-12
Python實(shí)現(xiàn)柵欄密碼的加密解密方法詳解
這篇文章主要介紹了Python實(shí)現(xiàn)柵欄密碼的加密解密方法,所謂柵欄密碼,就是把要加密的明文分成N個(gè)一組,然后把每組的第1個(gè)字連起來,形成一段無規(guī)律的話。不過柵欄密碼本身有一個(gè)潛規(guī)則,就是組成柵欄的字母一般不會(huì)太多2023-01-01
Python如何通過手肘法實(shí)現(xiàn)k_means聚類詳解
K-means聚類算法是一種常見的無監(jiān)督學(xué)習(xí)算法,用于將數(shù)據(jù)集分成k個(gè)不同的簇,下面這篇文章主要給大家介紹了關(guān)于Python如何通過手肘法實(shí)現(xiàn)k_means聚類的相關(guān)資料,需要的朋友可以參考下2023-04-04
Python標(biāo)準(zhǔn)庫pathlib操作目錄和文件
這篇文章主要為大家介紹了Python標(biāo)準(zhǔn)庫pathlib操作目錄和文件的示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-11-11
Django實(shí)現(xiàn)文件分享系統(tǒng)的完整代碼
這篇文章主要介紹了Django實(shí)現(xiàn)文件分享系統(tǒng),本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-05-05

