亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python知識點詳解之正則表達式語法

 更新時間:2022年05月31日 10:03:11   作者:夢想橡皮擦  
正則表達式在搜索大型文本、電子郵件和文檔時非常有用,正則表達式也稱為"用于字符串匹配的編程語言",下面這篇文章主要給大家介紹了關于Python知識點之正則表達式語法的相關資料,需要的朋友可以參考下

Python 正則表達式是什么

學習 Python 正則表達式離不開 re 模塊,所以本篇博客會配合 re 模塊進行編寫。

re 庫是 Python 中處理正則表達式的標準庫,本篇博客介紹 re 庫的同時,會簡單介紹一下正則表達式語法, 如果想深入學習正則表達式,還需要好好下一番功夫。

怎么用

正則表達式語法

正則表達式語法由字符和操作符構成,初期階段掌握下述這些內容即可。

操作符說明例子
.任何單個字符,極少不能匹配 
[]字符集,對單個字符給出取值范圍[abc] 表示匹配 a、b、c,[a-z] 表示 a 到 z 單個字符
[^]非字符集,對單個字符給出排除范圍[^abc] 表示匹配 非 a、非 b、非 c 的單個字符
*前一個字符 0 次或無限次擴展abc* 表示 ab、abc、abcc、abccc 等
+前一個字符 1 次或無限次擴展abc+ 表示 abc、abcc、abccc 等
?前一個字符 0 次或 1 次abc? 表示 ab、abc
|左右表達式任意一個abc|def 表示 abc 或者 def
{m}擴展前 1 個字符 m 次ab{2}c,表示 abbc
{m,n}擴展前 1 個字符 m 到 n 次ab{1,2}c,表示 abc、abbc
^匹配字符串開頭^abc 表示 abc 在字符串開頭
$匹配字符串結尾abc$ 表示 abc 在字符串結尾
()分組標記,內部僅能使用 | 操作符(abc) 表示 abc,(a
\d數字,等價于 [0-9] 
\w字符,等價于 [A-Za-z0-9] 

以上表示僅僅為正則表達最基礎部分內容,如果希望深入研究正則表達式,建議尋找更加全面的資料進行學習,本文只做藥引。

re 庫基本用法

re 庫主要函數如下:

  • 基礎函數:compile;
  • 功能函數:search、match、findall、split、finditer、sub。

在正式學習之前,先了解一下原生字符串。

在 Python 中,表示原生字符串,需要在字符串前面加上 r。 例如 my_str = 'i'am xiangpica' 在程序中會直接報錯, 如果希望字符串中 ' 可以正常運行,需要加上轉移字符 \,修改為 my_str = 'i\'am xiangpica'。 但這樣結合上文正則表達式中的操作符,就會出現(xiàn)問題,因為 \ 在正則表達式中是有真實含義的, 如果你使用 re 庫去匹配字符串中的 \,那需要使用 4 個反斜杠,為了避免這種情況出現(xiàn),引入了原生字符串概念。

# 不使用原生字符串的正則表達式  "\\\\"
# 使用原生字符串的正則表達式 r"\\"

在后文會有實際的應用。

接下來在學習一個案例,例如下述代碼:

my_str='C:\number'

print(my_str)
C:
umber

本段代碼的輸出效果如下,\n 被解析成了換行,如果想要屏蔽這種現(xiàn)象,使用 r 即可:

my_str=r'C:\number'

print(my_str)

輸出 C:\number。

re.search 函數

該函數用于,在字符串中搜索正則表達式匹配到的第一個位置的值,返回 match 對象。 函數原型如下:

re.search(pattern,string,flags=0)

需求:在字符串 夢想橡皮擦 good good 中匹配 橡皮擦。

import re
my_str='夢想橡皮擦 good good'
pattern = r'橡皮擦'

ret = re.search(pattern,my_str)
print(ret)

返回結果:<re.Match object; span=(2, 5), match='橡皮擦'>。

search 函數的第三個參數 flags 表示正則表達式使用時的控制標記。

  • re.I,re.IGNORECASE:忽略正則表達式的大小寫;
  • re.M,re.MULTILINE:正則表達式中的 ^ 操作符能夠將給定字符串的每行當做匹配的開始;
  • re.S,re.DOTALL:正則表達式中的 . 操作符能夠匹配所有字符。

最后將匹配到的字符串進行輸出,使用下述代碼即可實現(xiàn)。

import re
my_str = '夢想橡皮擦 good good'
pattern = r'橡皮擦'

ret = re.search(pattern, my_str)
if ret:
    print(ret.group(0))

re.match 函數

該函數用于在目標字符串開始位置去匹配正則表達式,返回 match 對象,未匹配成功返回 None,函數原型如下:

re.match(pattern,string,flags=0)

一定要注意是目標字符串開始位置。

import re
my_str = '夢想橡皮擦 good good'
pattern = r'夢' # 匹配到數據
pattern = r'good' # 匹配不到數據

ret = re.match(pattern, my_str)
if ret:
    print(ret.group(0))

re.match 和 re.search 方法都是一次最多返回一個匹配對象,如果希望返回多個值, 可以通過在 pattern 里加括號構造匹配組返回多個字符串。

re.findall 函數

該函數用于搜索字符串,以列表格式返回全部匹配到的字符串,函數原型如下:

re.findall(pattern,string,flags=0)

測試代碼如下:

import re
my_str = '夢想橡皮擦 good good'
pattern = r'good'
ret = re.findall(pattern, my_str)
print(ret)

re.split 函數

該函數將一個字符串按照正則表達式匹配結果進行分割,返回一個列表。 函數原型如下:

re.split(pattern, string, maxsplit=0, flags=0)

re.split 函數進行分割的時候,如果正則表達式匹配到的字符恰好在字符串開頭或者結尾, 返回分割后的字符串列表首尾都多了空格,需要手動去除,例如下述代碼:

import re
my_str = '1夢想橡皮擦1good1good1'

pattern = r'\d'

ret = re.split(pattern, my_str)

print(ret)

運行結果:

['', '夢想橡皮擦', 'good', 'good', '']

切換為中間的內容,則能正確的分割字符串。

import re
my_str = '1夢想橡皮擦1good1good1'

pattern = r'good'

ret = re.split(pattern, my_str)

print(ret)

如果在 pattern 中捕獲到括號,那括號中匹配到的結果也會在返回的列表中。

import re
my_str = '1夢想橡皮擦1good1good1'

pattern = r'(good)'

ret = re.split(pattern, my_str)

print(ret)

運行結果,你可以對比帶括號和不帶括號的區(qū)別進行學習:

['1夢想橡皮擦1', 'good', '1', 'good', '1']

maxsplit 參數表示最多進行分割次數, 剩下的字符全部返回到列表的最后一個元素, 例如設置匹配 1 次,得到的結果是 ['1夢想橡皮擦1', '1good1']。

re.finditer 函數

搜索字符串,并返回一個匹配結果的迭代器,每個迭代元素都是 match 對象。 函數原型如下:

re.finditer(pattern,string,flags=0)

測試代碼如下:

import re
my_str = '1夢想橡皮擦1good1good1'

pattern = r'good'

# ret = re.split(pattern, my_str,maxsplit=1)
ret =re.finditer(pattern, my_str)
print(ret)

re.sub 函數

在一個字符串中替換被正則表達式匹配到的字符串,返回替換后的字符串, 函數原型如下:

re.sub(pattern,repl,string,count=0,flags=0)

其中 repl 參數是替換匹配字符串的字符串,count 參數是匹配的最大替換次數。

import re
my_str = '1夢想橡皮擦1good1good1'

pattern = r'good'

ret = re.sub(pattern, "nice", my_str)
print(ret)

運行之后,得到替換之后的字符串:

1夢想橡皮擦1nice1nice1

re 庫其它函數

其它比較常見的函數有:re.fullmatch(),re.subn(),re.escape(), 更多內容可以查閱 官方文檔,獲取一手資料。

擴展知識

使用 re 庫匹配字符串之后,會返回 match 對象,該對象具備以下屬性和方法。

你可以順著這條線繼續(xù)學習下去。

總結

到此這篇關于Python知識點詳解之正則表達式語法的文章就介紹到這了,更多相關Python正則表達式語法內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Python實現(xiàn)文件操作幫助類的示例代碼

    Python實現(xiàn)文件操作幫助類的示例代碼

    在使用Python進行業(yè)務開發(fā)的時候,需要將一些數據保存到本地文件存儲,方便后面進行數據分析展示,本文就來用Python制作一個文件操作幫助類,需要的可以參考一下
    2023-03-03
  • python實現(xiàn)圖像降噪

    python實現(xiàn)圖像降噪

    這篇文章主要為大家詳細介紹了python實現(xiàn)圖像降噪,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-08-08
  • Python+Pytest實現(xiàn)壓力測試詳解

    Python+Pytest實現(xiàn)壓力測試詳解

    在現(xiàn)代Web應用程序中,性能是至關重要的。為了確保應用程序能夠在高負載下正常運行,我們需要進行性能測試。本文就來用Pytest進行壓力測試,希望對大家有所幫助
    2023-03-03
  • Python入門篇之字符串

    Python入門篇之字符串

    可能大多數人在學習C語言的時候,最先接觸的數據類型就是字符串,因為大多教程都是以"Hello world"這個程序作為入門程序,這個程序中要打印的"Hello world"就是字符串。今天我們來了解一下Python中的字符串,看看它的用法。
    2014-10-10
  • python生成九宮格圖片

    python生成九宮格圖片

    這篇文章主要為大家詳細介紹了python生成九宮格圖片,利用Image類將一張圖片分割成9張,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-11-11
  • Python命名空間與作用域深入全面詳解

    Python命名空間與作用域深入全面詳解

    命名空間是從名稱到對象的映射,大部分的命名空間都是通過 Python 字典來實現(xiàn)的,作用域就是一個可以直接訪問命名空間的正文區(qū)域。程序的變量并不是在哪個位置都可以訪問的,訪問權限決定于這個變量是在哪里賦值的
    2022-11-11
  • 解決安裝新版PyQt5、PyQT5-tool后打不開并Designer.exe提示no Qt platform plugin的問題

    解決安裝新版PyQt5、PyQT5-tool后打不開并Designer.exe提示no Qt platform plug

    這篇文章主要介紹了解決安裝新版PyQt5、PyQT5-tool后打不開并Designer.exe提示no Qt platform plugin的問題,需要的朋友可以參考下
    2020-04-04
  • python對數組進行反轉的方法

    python對數組進行反轉的方法

    這篇文章主要介紹了python對數組進行反轉的方法,涉及Python中reverse方法的使用技巧,需要的朋友可以參考下
    2015-05-05
  • python編程webpy框架模板之def with學習

    python編程webpy框架模板之def with學習

    這篇文章主要為大家介紹了python編程web.py框架模板之def with的學習有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步
    2021-11-11
  • Python發(fā)送郵件的實例代碼講解

    Python發(fā)送郵件的實例代碼講解

    在本篇文章里小編給大家整理的是關于Python發(fā)送郵件的實例代碼講解內容,需要的朋友們可以參考下。
    2019-10-10

最新評論