亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python使用re模塊實現(xiàn)信息篩選的方法

 更新時間:2018年04月29日 11:41:58   作者:徐文  
這篇文章主要介紹了Python使用re模塊實現(xiàn)信息篩選的方法,結(jié)合實例形式分析了Python正則re模塊進(jìn)行信息篩選操作的相關(guān)實現(xiàn)技巧及相關(guān)函數(shù)使用技巧,需要的朋友可以參考下

本文實例講述了Python使用re模塊實現(xiàn)信息篩選的方法。分享給大家供大家參考,具體如下:

背景

平時工作中,我們經(jīng)常會處理大量的元數(shù)據(jù)(Raw Data),而一般的文件編輯器只能一次查詢一個關(guān)鍵字,這就難以連續(xù)的分析元數(shù)據(jù),比如分析產(chǎn)品日志文件(log),日志可能包括很多information級別的信息,這些一般是我們不太關(guān)心的,我們主要關(guān)心的是一些特殊的調(diào)試(Debug)級別的信息,所以就有必要根據(jù)很多關(guān)鍵字篩選出來日志文件中我們所關(guān)系的信息,這樣篩選出來的日志文件不僅具有連續(xù)性,而且易讀性會非常好。

解決方案

re是Python自帶的正則表達(dá)式庫文件,為字符串的匹配篩選提供了極大的便利,本文就是利用re來進(jìn)行日志文件的信息篩選。首先,簡單來看一下re中的主要函數(shù):

1. Compile(pattern, flag):對正則表達(dá)式進(jìn)行編譯,比檢查語法的正確性。flag是編譯的標(biāo)簽,這里只介紹DOTALL,表示匹配所有的字符,包括新的行。

>>> import re
>>> re.compile('[abc]+')
re.compile('[abc]+')
>>> re.compile(test)
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
NameError: name 'test' is not defined
>>>

2. match(): 從目標(biāo)字符串的開頭來判斷是否與正則表達(dá)式匹配,如果不匹配返回None,反之,返回匹配對象,包括起始位置,結(jié)束位置,字符串內(nèi)容

>>> import re
>>> test = re.compile('[abc]+')
>>> test.match('dabc')
>>> test.match('babc')
<_sre.SRE_Match object; span=(0, 4), match='babc'>

test是一個以a或b或c開頭的正則表達(dá)式編譯對象,而match是從目標(biāo)字符串的開頭進(jìn)行匹配,所以第一個目標(biāo)字符串“dabc”不符合正則表達(dá)式規(guī)則,所以返回None;第二個目標(biāo)字符串可以正常匹配輸出匹配對象(起始位置,匹配內(nèi)容),由于match每次都從目標(biāo)字符串的開頭進(jìn)行匹配,所以如果有匹配字符串,其開始位置始終為0.

3. search:與match功能相近,search會掃描全目標(biāo)字符串進(jìn)行正則表達(dá)式匹配。

>>> import re
>>> test = re.compile('[abc]+')
>>> test.search('dabc')
<_sre.SRE_Match object; span=(1, 4), match='abc'>
>>>

這時用search就可以匹配a,b,c開頭的字符串了

4. findall:找出目標(biāo)字符串中所有的匹配字符串,并以列表的形式返回

>>> test = re.compile('\w+@163.com')
>>> test.findall(r"alvin@163.comtest1234@163.comnotvalid@gmail.com")
['alvin@163.com', 'test1234@163.com']

當(dāng)然,re中還有很多其他的函數(shù)可供大家使用,大家可以去查閱python官方文檔。

其次,介紹幾個正則表達(dá)式常用的符號:

1. *: 表示匹配其前面字符0或多次
2. .: 表示匹配新行之外的所有字符
3. |: 表示或操作
4. +:表示匹配其前面緊鄰字符一次或多次
5. ?: 表示匹配0或1次

其他的正則表達(dá)式的表示也可去官網(wǎng)文檔查看。

最后,上一下這個簡單的篩選程序:

import re
source = 'GCM.txt'
target = 'g2s.txt'
#一級篩選
raw_compile = re.compile(r"<g2s:g2sMessage.*?</g2s:g2sMessage>",re.DOTALL)
#二級篩選
messagelevel_compile = re.compile(r"<igtLicensing.*|<g2s:idReader.*",re.DOTALL)
#二級篩選
egmlevel_compile = re.compile(r"IGT_00012E2335AA.*",re.DOTALL)
def FilterG2SMessage():
  fr = open(source)
  content = fr.read()
  fr.close()
  f = open(target,'w')
  g2sItems = raw_compile.findall(content)
  for g2s in g2sItems:
    iscaredG2S = messagelevel_compile.search(g2s)
    isCaredEGM = egmlevel_compile.search(g2s)
    if iscaredG2S and isCaredEGM:
      f.write(g2s+'\n')
    else:
      pass
  f.close()
FilterG2SMessage()

程序很簡單,在篩選的過程中大家可以先分析一下篩選的級別,可以逐級篩選。

總結(jié):

re不僅僅提供了正則表達(dá)式的匹配,而且提供了一些批量處理的函數(shù),比如split,sub,subn等等,這些函數(shù)都可以提高我們對文件內(nèi)容的快速處理,節(jié)省時間。

PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:

JavaScript正則表達(dá)式在線測試工具:
http://tools.jb51.net/regex/javascript

正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg

更多關(guān)于Python相關(guān)內(nèi)容可查看本站專題:《Python正則表達(dá)式用法總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總

希望本文所述對大家Python程序設(shè)計有所幫助。

相關(guān)文章

  • Python 字符串的有關(guān)知識詳解

    Python 字符串的有關(guān)知識詳解

    這篇文章主要為大家介紹了Python的字符串,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助,希望能夠給你帶來幫助
    2021-11-11
  • 解決python 讀取npy文件太大不能完全顯示的問題

    解決python 讀取npy文件太大不能完全顯示的問題

    這篇文章主要介紹了解決python 讀取npy文件太大不能完全顯示的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • Python Google風(fēng)格注釋的使用

    Python Google風(fēng)格注釋的使用

    Google風(fēng)格注釋是一種Python代碼注釋的標(biāo)準(zhǔn)化格式,它提供了一種規(guī)范的注釋格式,使得代碼更加易讀、易于維護(hù),本文就來介紹一下Google風(fēng)格注釋的語法和用法,感興趣的可以了解一下
    2023-11-11
  • Python通過字典映射函數(shù)實現(xiàn)switch

    Python通過字典映射函數(shù)實現(xiàn)switch

    這篇文章主要介紹了Python通過字典映射函數(shù)實現(xiàn)switch,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-11-11
  • python實現(xiàn)從尾到頭打印單鏈表操作示例

    python實現(xiàn)從尾到頭打印單鏈表操作示例

    這篇文章主要介紹了python實現(xiàn)從尾到頭打印單鏈表操作,結(jié)合實例形式分析了Python單鏈表的定義、判斷、添加、打印等相關(guān)操作技巧,需要的朋友可以參考下
    2020-02-02
  • python清除字符串前后空格函數(shù)的方法

    python清除字符串前后空格函數(shù)的方法

    今天小編就為大家分享一篇python清除字符串前后空格函數(shù)的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-10-10
  • 使用python實現(xiàn)將excel數(shù)據(jù)導(dǎo)入word并設(shè)置字體樣式的代碼示例

    使用python實現(xiàn)將excel數(shù)據(jù)導(dǎo)入word并設(shè)置字體樣式的代碼示例

    在日常辦公和數(shù)據(jù)處理中,我們經(jīng)常需要將Excel中的數(shù)據(jù)導(dǎo)入到Word文檔中,手動完成這個過程可能既費時又容易出錯,本文將介紹如何使用Python自動化這一任務(wù),需要的朋友可以參考下
    2024-02-02
  • python2.7無法使用pip的解決方法(安裝easy_install)

    python2.7無法使用pip的解決方法(安裝easy_install)

    下面小編就為大家分享一篇python2.7無法使用pip的解決方法(安裝easy_install),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • Python代碼調(diào)試技巧教程詳解

    Python代碼調(diào)試技巧教程詳解

    這篇文章主要為大家介紹了Python代碼的一些方便快捷的調(diào)試技巧,文中含有詳細(xì)新的步驟操作,有需要的朋友可以借鑒參考下,希望能夠有所幫助
    2021-10-10
  • python中正則表達(dá)式與模式匹配

    python中正則表達(dá)式與模式匹配

    在之前找工作過程中,面試時經(jīng)常被問到會不會python,懂不懂正則表達(dá)式。這篇文章主要介紹了python中正則表達(dá)式與模式匹配,需要的朋友可以參考下
    2019-05-05

最新評論