Python如何匹配文本并在其上一行追加文本

更新時間：2022年05月10日 14:26:15 作者：XerCis

這篇文章主要介紹了Python如何匹配文本并在其上一行追加文本，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教

匹配文本并在其上一行追加文本

問題描述

Python匹配文本并在其上一行追加文本

test.txt

a
b
c
d
e

1.讀進列表后覆蓋原文件

def match_then_insert(filename, match, content):
? ? """匹配后在該行追加
? ? :param filename: 要操作的文件
? ? :param match: 匹配內容
? ? :param content: 追加內容
? ? """
? ? lines = open(filename).read().splitlines()
? ? index = lines.index(match)
? ? lines.insert(index, content)
? ? open(filename, mode='w').write('\n'.join(lines))
match_then_insert('test.txt', match='c', content='123')

效果

a
b
123
c
d
e

2.FileInput類

from fileinput import FileInput
def match_then_insert(filename, match, content):
? ? """匹配后在該行追加
? ? :param filename: 要操作的文件
? ? :param match: 匹配內容
? ? :param content: 追加內容
? ? """
? ? for line in FileInput(filename, inplace=True): ?# 原地過濾
? ? ? ? if match in line:
? ? ? ? ? ? line = content + '\n' + line
? ? ? ? print(line, end='') ?# 輸出重定向到原文件
match_then_insert('test.txt', match='c', content='123')

3.seek

def match_then_insert(filename, match, content):
? ? """匹配后在該行追加
? ? :param filename: 要操作的文件
? ? :param match: 匹配內容
? ? :param content: 追加內容
? ? """
? ? with open(filename, mode='rb+') as f:
? ? ? ? while True:
? ? ? ? ? ? try:
? ? ? ? ? ? ? ? line = f.readline() ?# 逐行讀取
? ? ? ? ? ? except IndexError: ?# 超出范圍則退出
? ? ? ? ? ? ? ? break
? ? ? ? ? ? line_str = line.decode().splitlines()[0]
? ? ? ? ? ? if line_str == match:
? ? ? ? ? ? ? ? f.seek(-len(line), 1) ?# 光標移動到上一行
? ? ? ? ? ? ? ? rest = f.read() ?# 讀取余下內容
? ? ? ? ? ? ? ? f.seek(-len(rest), 1) ?# 光標移動回原位置
? ? ? ? ? ? ? ? f.truncate() ?# 刪除余下內容
? ? ? ? ? ? ? ? content = content + '\n'
? ? ? ? ? ? ? ? f.write(content.encode()) ?# 插入指定內容
? ? ? ? ? ? ? ? f.write(rest) ?# 還原余下內容
? ? ? ? ? ? ? ? break
match_then_insert('test.txt', match='c', content='123')

對比

方案	耗時/s
讀進列表后覆蓋原文件	54.42
FileInput類	121.59
seek	3.53

from timeit import timeit
from fileinput import FileInput
def init_txt():
    open('test.txt', mode='w').write('\n'.join(['a', 'b', 'c', 'd', 'e']))
def f1(filename='test.txt', match='c', content='123'):
    lines = open(filename).read().splitlines()
    index = lines.index(match)
    lines.insert(index, content)
    open(filename, mode='w').write('\n'.join(lines))
def f2(filename='test.txt', match='c', content='123'):
    for line in FileInput(filename, inplace=True):
        if match in line:
            line = content + '\n' + line
        print(line, end='')
def f3(filename='test.txt', match='c', content='123'):
    with open(filename, mode='rb+') as f:
        while True:
            try:
                line = f.readline()
            except IndexError:
                break
            line_str = line.decode().splitlines()[0]
            if line_str == match:
                f.seek(-len(line), 1)
                rest = f.read()
                f.seek(-len(rest), 1)
                f.truncate()
                content = content + '\n'
                f.write(content.encode())
                f.write(rest)
                break
init_txt()
print(timeit(f1, number=1000))
init_txt()
print(timeit(f2, number=1000))
init_txt()
print(timeit(f3, number=1000))

遇到的坑

報錯可試試在文件頭部添加

# -*- coding: utf-8 -*-

或指定 encoding='utf-8'

用正則表達式匹配文本(Python經(jīng)典編程案例)

ceshi.txt文本如下：第一行為空行

爬蟲任務報警
01:45:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-1
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: ah_sina_com_cn,job: 28395818dbcb11e998a3f632d94e247c,pid: 88971,log: data/logs/chinabond_fast_spider/ah_sina_com_cn/28395818dbcb11e998a3f632d94e247c.log,items: None
error_data:
爬蟲任務報警
01:45:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-6
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: shupeidian_bjx_com_cn,job: 04738a5cdbcb11e9803172286b76aa73,pid: 34246,log: data/logs/chinabond_fast_spider/shupeidian_bjx_com_cn/04738a5cdbcb11e9803172286b76aa73.log,items: None
error_data:
爬蟲任務報警
01:45:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-6
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: news_sdchina_com,job: 28e8db4edbcb11e9803172286b76aa73,pid: 34324,log: data/logs/chinabond_fast_spider/news_sdchina_com/28e8db4edbcb11e9803172286b76aa73.log,items: None
error_data:
爬蟲任務報警
01:47:20
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-0
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: hq_smm_cn,job: 4bdc3af6dbcb11e9a45522b8c8b2a9e4,pid: 111593,log: data/logs/chinabond_fast_spider/hq_smm_cn/4bdc3af6dbcb11e9a45522b8c8b2a9e4.log,items: None
error_data:
爬蟲任務報警
01:47:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-6
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: sichuan_scol_com_cn,job: 71321c4edbcb11e9803172286b76aa73,pid: 34461,log: data/logs/chinabond_fast_spider/sichuan_scol_com_cn/71321c4edbcb11e9803172286b76aa73.log,items: None
error_data:
爬蟲任務報警
01:47:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-2
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: www_mof_gov_cn,job: 7418dacedbcb11e9b15e02034af50b6e,pid: 65326,log: data/logs/chinabond_fast_spider/www_mof_gov_cn/7418dacedbcb11e9b15e02034af50b6e.log,items: None
error_data:
爬蟲任務報警
01:47:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-5
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: www_funxun_com,job: 4dcda7a0dbcb11e980a8862f09ca6d70,pid: 27785,log: data/logs/chinabond_fast_spider/www_funxun_com/4dcda7a0dbcb11e980a8862f09ca6d70.log,items: None
error_data:
爬蟲任務報警
01:49:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-4
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: shuidian_bjx_com_cn,job: 95090682dbcb11e9a0fade28e59e3773,pid: 106424,log: data/logs/chinabond_fast_spider/shuidian_bjx_com_cn/95090682dbcb11e9a0fade28e59e3773.log,items: None
error_data:
爬蟲任務報警
01:51:20
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-0
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: tech_sina_com_cn,job: de4bdf72dbcb11e9a45522b8c8b2a9e4,pid: 111685,log: data/logs/chinabond_fast_spider/tech_sina_com_cn/de4bdf72dbcb11e9a45522b8c8b2a9e4.log,items: None
error_data:
爬蟲任務報警
01:51:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-6
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: ee_ofweek_com,job: ff6bd5b8dbcb11e9803172286b76aa73,pid: 34626,log: data/logs/chinabond_fast_spider/ee_ofweek_com/ff6bd5b8dbcb11e9803172286b76aa73.log,items: None
error_data:
爬蟲任務報警
01:51:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-6
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: house_hexun_com,job: ff6dfdacdbcb11e9803172286b76aa73,pid: 34633,log: data/logs/chinabond_fast_spider/house_hexun_com/ff6dfdacdbcb11e9803172286b76aa73.log,items: None
error_data:
爬蟲任務報警
01:51:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-2
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: www_sjfzxm_com,job: 018e7d78dbcc11e9b15e02034af50b6e,pid: 65492,log: data/logs/chinabond_fast_spider/www_sjfzxm_com/018e7d78dbcc11e9b15e02034af50b6e.log,items: None
error_data:
爬蟲任務報警
01:53:21
scrapyd==》爬蟲任務異常死亡報警
hostname: scrapyd-chinabond-4
error_count: Process died: exitstatus=None ,project: chinabond_fast_spider,spider: news_xianzhaiwang_cn,job: 48d835e8dbcc11e9a0fade28e59e3773,pid: 106476,log: data/logs/chinabond_fast_spider/news_xianzhaiwang_cn/48d835e8dbcc11e9a0fade28e59e3773.log,items: None
error_data:

代碼如下：

import os
import re
import json
from collections import namedtuple
alert = namedtuple('Spider_Alert', 'alert_time, alert_hostname, alert_project, alert_spider')
path = r'D:\data\ceshi.txt'
g_path = r'D:\data\\'
file_name = r'result.txt'
file_path = g_path + file_name
alerts_list = list()
with open(path, encoding="utf-8") as file:
    lines = file.readlines()  # 讀取每一行
    count = 0
    time = None
    hostname = None
    project = None
    for line in lines:
        if re.search(r'^\d{2}:\d{2}:\d{2}\s*$', line):
            time = re.search(r'^(\d{2}:\d{2}:\d{2})\s*$', line).group(1)
        if re.search(r'^hostname:\s*(.+)', line):
            hostname = re.search(r'^hostname:\s*(.+)', line).group(1)
        if re.search(r'project:\s*([^,]+),', line):
            project = re.search(r'project:\s*([^,]+),', line).group(1)
        if re.search(r'spider:\s*([^,]+),', line):
            spider = re.search(r'spider:\s*([^,]+),', line).group(1)
        if re.search(r'^error_data', line):
            spider_alert = None
            spider_alert = alert(alert_time=time, alert_hostname=hostname, alert_project=project, alert_spider=spider)
            alerts_list.append(spider_alert)
for element in alerts_list:
    print(element[0], element[1], element[3])
    with open(file_path, 'a', encoding="utf-8") as file:
        file.write(element[0] + "\t" + element[1] + "\t" + element[3])
        file.write(' \n')

執(zhí)行結果如下圖：

以上為個人經(jīng)驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

Python實現(xiàn)查找數(shù)組中任意第k大的數(shù)字算法示例
這篇文章主要介紹了Python實現(xiàn)查找數(shù)組中任意第k大的數(shù)字算法,涉及Python針對數(shù)組的排序、查找等相關操作技巧,需要的朋友可以參考下
2019-01-01
PyQt5實現(xiàn)五子棋游戲（人機對弈）
這篇文章主要為大家詳細介紹了PyQt5實現(xiàn)五子棋游戲，人機對弈，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2019-01-01
python 使用值來排序一個字典的方法
這篇文章主要介紹了python 使用值來排序一個字典的方法，非常不錯，具有一定的參考借鑒價值 ,需要的朋友可以參考下
2018-11-11
老生常談Python中的Pickle庫
pickle是python語言的一個標準模塊，安裝python后已包含pickle庫，不需要單獨再安裝。這篇文章主要介紹了Python中的Pickle庫,需要的朋友可以參考下
2022-01-01
Appium+Python+pytest自動化測試框架的實戰(zhàn)
本文主要介紹了Appium+Python+pytest自動化測試框架的實戰(zhàn)，文中通過示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2021-12-12
python3.7 使用pymssql往sqlserver插入數(shù)據(jù)的方法
這篇文章主要介紹了python3.7 使用pymssql往sqlserver插入數(shù)據(jù)的方法，代碼很簡單，感興趣的朋友跟隨小編一起看看吧
2019-07-07
python自定義線程池控制線程數(shù)量的示例
今天小編就為大家分享一篇python自定義線程池控制線程數(shù)量的示例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-02-02
python關于字典及遍歷的常用方法
這篇文章主要介紹了python關于字典及遍歷的常用方法，字典的鍵可以是字符串、整數(shù)、元組或字典。字典的值也可以是字符串、整數(shù)，文章圍繞主題展開更多詳細的內容，需要的小伙伴可以參考一下
2022-06-06
Python3之文件讀寫操作的實例講解
下面小編就為大家分享一篇Python3之文件讀寫操作的實例講解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-01-01
QT5 Designer 打不開的問題及解決方法
這篇文章主要介紹了QT5 Designer 打不開的問題及解決方法,本文給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2020-08-08