Python中使用正則表達式及正則表達式匹配規(guī)則詳解
1 導庫
import re
2 使用模板
re_pattern = re.compile(pattern, flags=0) result = re.findall(re_pattern,string)
3 說明
參數(shù) | 描述 |
pattern | 匹配的正則表達式,如 r'abc' 可用來匹配abc |
flags | 可選,標志位,控制匹配方式,可選值: re.I 忽略大小寫 re.L 表示特殊字符集\w \W \b \B \s \S,依賴于當前環(huán)境 re.M 多行模式 re.S 包括換行符在內的任意字符 re.U 根據(jù)Unicode字符集解析字符 re.X 為了增加可讀性,忽略空格和#后面的注釋 re.A 根據(jù)ASCII碼解析字符 |
string | 待匹配字符串 |
方法 | 描述 |
compile | 編譯正則表達式,生成一個正則表達式(Pattern)對象 |
findall | 全文匹配,匹配結果以列表形式返回 |
4 示例
以下代碼用來在字符串 str 中匹配符合如下規(guī)則的字符串:
中英文括號開頭+1個大寫字母+1個或無限個數(shù)字+0個或1個字符“.”+0個或1個字符“/”+0個或無限個數(shù)字+中英文括號結尾
# 導庫 import re # 待處理字符串 str = '小分裂細胞型(彌漫性)非霍奇金淋巴瘤(M96720/3)(Y97.1)(Y77)(yyy)' # 設定匹配規(guī)則,編譯 re_str = re.compile(r'[(|(][A-Z][0-9]+[.]?[/]?[0-9]*[)|)]', re.S) # 匹配 ans = re.findall(re_str,str) # 打印 print(ans)
在字符串 str 中的匹配結果如下,可見有三個字符串符合匹配規(guī)則:
5 正則表達式匹配規(guī)則
語法 | 描述 | 正則表達式示例 | 對應可匹配字符串示例 |
一般字符 | 匹配自身 | abc | abc |
元字符 | |||
. | 除了換行符之外的任意單個字符 | a.c | abc |
* | 匹配前面一個字符0或無限次 | ab* | a abbb |
+ | 匹配前面一個字符1次或無限次 | ab+ | ab abbb |
? | 匹配前面一個字符0次或1次 | ab? | a ab |
\ | 轉義符,使后面一個字符保持原來的意思 | a\.b | a.b |
[] | 字符集,里面的字符可以是任意數(shù)量個字符,也可以是一個范圍,比如可以是[abc]或者[a-c],均表示匹配abc中的一個字符。同時,可以將第一個字符設為^,用來表示取反,如[^abc]表示除了abc以外的字符。 注意,所有的特殊字符在[]內都失去其原有的特殊含義,如[.]僅表示匹配字符.而不是匹配任意字符了,當然,如果要使用]、-或^三個字符,仍需要使用轉義字符\ | [abc] [a-c] | a b c |
{m} | m是一個非負整數(shù),表示匹配前一個字符m次 | abc{2} | abcc |
{m,n} | m和n都是非負整數(shù),且m≤n,表示最少匹配m次且最多匹配n次 | ab{2,4}c | abbc |
| | 邏輯或,匹配左右表達式中的任意一個。具有“短路”特點,先匹配左側表達式,再匹配右側表達式。建議用()括起來,否則會作用于整個正則表達式 | abc|123 | abc 123 |
() | 括號,將表達式括起來作為一個分組。分組表達式是一個整體 | a(bc)?d | ad abcd |
定位符 | |||
^ | 匹配字符串的開頭字符 | ^abc | abc |
$ | 匹配字符串的結尾字符 | abc$ | abc |
\b | 匹配一個單詞的邊界 如\bab表示匹配字符串a(chǎn)b且ab前面要是空格 如ab\b表示匹配字符串a(chǎn)b且ab后面要是空格 | \bab | 可以匹配到abc中的ab 無法匹配到cab中的ab |
\B | 匹配非邊界 | \Bab | 可以匹配到cab中的ab 無法匹配到abc中的ab |
預定義字符集 | |||
\d | 匹配數(shù)字,等價于[0-9] | a\dc | a1c |
\D | 匹配非數(shù)字,等價于[^\d] | a\Dc | abc |
\s | 匹配空白字符,包括空格、制表符、換頁符等 | a\sc | a c |
\S | 匹配非空白字符,等價于[^\s] | a\Sc | abc |
\w | 匹配字母數(shù)字下劃線,等價于[a-zA-Z0-9_] | a\wc | a_c |
\W | 匹配非字母數(shù)字下劃線,等價于[^\w] | a\Wc | a c |
到此這篇關于Python中使用正則表達式以及正則表達式匹配規(guī)則的文章就介紹到這了,更多相關Python正則表達式匹配規(guī)則內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
詳解用python -m http.server搭一個簡易的本地局域網(wǎng)
這篇文章主要介紹了詳解用python -m http.server搭一個簡易的本地局域網(wǎng),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-09-09pytorch獲取模型某一層參數(shù)名及參數(shù)值方式
今天小編就為大家分享一篇pytorch獲取模型某一層參數(shù)名及參數(shù)值方式,具有很好的價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12教你漂亮打印Pandas DataFrames和Series
在今天的文章中,我們將探討如何配置所需的pandas選項,這些選項將使我們能夠“漂亮地打印” pandas DataFrames,需要的朋友可以參考下2021-05-05