亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python正則表達式標準庫之re庫的詳細介紹

 更新時間:2025年06月30日 10:54:24   作者:wanglaqqqq  
Python的re庫是用于處理正則表達式的標準庫,正則表達式是一種強大而靈活的文本處理工具,能夠幫助你執(zhí)行復雜的字符串匹配和替換操作,這篇文章主要介紹了python正則表達式標準庫之re庫的詳細介紹,需要的朋友可以參考下

1. 模塊概述

re 是 Python 標準庫中用于正則表達式操作的模塊,提供字符串的復雜模式匹配、搜索、替換等功能。正則表達式(Regex)通過特定語法規(guī)則描述字符串模式,適用于文本解析、數據清洗、輸入驗證等場景。

2. 核心概念

?**(1) 正則表達式語法**

  • ?普通字符:如 a、1 直接匹配自身。
  • ?特殊字符
    • .:匹配任意字符(除換行符,除非啟用 re.DOTALL)。
    • ^:匹配字符串開頭。
    • $:匹配字符串結尾。
    • \d:匹配數字(等價于 [0-9])。
    • \w:匹配字母、數字、下劃線(等價于 [a-zA-Z0-9_])。
    • \s:匹配空白符(空格、制表符、換行等)。
    • []:字符集合(如 [a-z] 匹配小寫字母)。
    • |:邏輯或(如 a|b 匹配 a 或 b)。
  • ?量詞
    • *:匹配前一個字符 0 次或多次。
    • +:匹配前一個字符 1 次或多次。
    • ?:匹配前一個字符 0 次或 1 次。
    • {m}:匹配前一個字符恰好 m 次。
    • {m,n}:匹配前一個字符 m 到 n 次。
  • ?分組與捕獲
    • ():定義捕獲組(可通過索引或命名引用)。
    • (?:):非捕獲組(僅分組,不捕獲)。

?**(2) 修飾符(Flags)?**

修飾符描述
re.IGNORECASE (或 re.I)忽略大小寫
re.MULTILINE (或 re.M)多行模式(^ 和 $ 匹配每行的開頭/結尾)
re.DOTALL (或 re.S). 匹配包括換行符在內的所有字符
re.VERBOSE (或 re.X)允許正則表達式換行并添加注釋

?3. 常用函數與示例

?**(1) 匹配與搜索**

函數描述示例
re.match(pattern, string)?從字符串開頭匹配模式,成功返回 Match 對象,否則返回 None。re.match(r'\d+', '123abc') → Match 對象(匹配 '123')
re.search(pattern, string)?掃描整個字符串查找第一個匹配,成功返回 Match 對象,否則返回 None。re.search(r'\d+', 'abc123def') → Match 對象(匹配 '123')
re.findall(pattern, string)返回所有非重疊匹配的列表(直接返回字符串或元組列表)。re.findall(r'\d+', 'a1b22c333') → ['1', '22', '333']
re.finditer(pattern, string)返回所有匹配的迭代器,每個元素是 Match 對象。[m.group() for m in re.finditer(r'\d+', 'a1b22')] → ['1', '22']

 示例代碼

import re

text = "Email: user@example.com, Phone: 123-456-7890"
# 提取郵箱
email = re.search(r'\w+@\w+\.\w+', text).group()  # 'user@example.com'
# 提取所有電話號碼片段
phones = re.findall(r'\d{3}-\d{3}-\d{4}', text)   # ['123-456-7890']

**(2) 替換與分割**

函數描述示例
re.sub(pattern, repl, string)將匹配模式的部分替換為 repl,返回新字符串。re.sub(r'\d+', '#', 'a1b22c') → 'a#b#c'
re.split(pattern, string)按模式分割字符串,返回列表。re.split(r'\W+', 'Hello, world!') → ['Hello', 'world', '']

 示例代碼

# 替換日期格式(YYYY-MM-DD → DD/MM/YYYY)
date = "2023-10-05"
new_date = re.sub(r'(\d{4})-(\d{2})-(\d{2})', r'\3/\2/\1', date)  # '05/10/2023'

# 分割復雜文本
text = "apple,,banana;;cherry"
parts = re.split(r'[,;]+', text)  # ['apple', 'banana', 'cherry']

**(3) 預編譯正則表達式**

使用 re.compile() 預編譯正則表達式以提高效率(尤其需多次使用同一模式時):

pattern = re.compile(r'\d+')
match = pattern.match('123abc')  # 等效于 re.match(r'\d+', '123abc')

**(4) 匹配對象(Match Object)?**

成功匹配后返回的 Match 對象提供以下方法:

方法描述
group(n)返回第 n 個分組(默認 n=0 表示整個匹配)。
groups()返回所有分組的元組。
start() / end()返回匹配的起始/結束索引。
span()返回匹配的索引范圍元組 (start, end)。

 示例

text = "Date: 2023-10-05"
match = re.search(r'(\d{4})-(\d{2})-(\d{2})', text)
if match:
    print(match.group(0))   # '2023-10-05'
    print(match.group(1))   # '2023'
    print(match.groups())   # ('2023', '10', '05')
    print(match.span(1))    # (6, 10)

4. 高級技巧

?**(1) 非貪婪匹配**

默認量詞(如 *+)是貪婪的(盡可能多匹配),添加 ? 可改為非貪婪模式:

# 貪婪匹配
re.findall(r'<.*>', '<div>text</div>')  # ['<div>text</div>']
# 非貪婪匹配
re.findall(r'<.*?>', '<div>text</div>') # ['<div>', '</div>']

**(2) 命名分組**

使用 (?P<name>...) 定義命名分組,通過 group('name') 訪問:

text = "ID: 123, Name: Alice"
match = re.search(r'ID: (?P<id>\d+), Name: (?P<name>\w+)', text)
print(match.group('id'))    # '123'
print(match.group('name'))  # 'Alice'

5. 常見問題與注意事項

  • ?轉義字符:在正則表達式中使用 \ 需寫成 \\,或使用原始字符串 r'' 簡化:

    python

    re.match(r'\d+', '123')    # 正確(原始字符串)
    re.match('\\d+', '123')    # 正確(常規(guī)字符串需轉義)
  • ?性能優(yōu)化

    • 多次使用同一模式時,預編譯正則表達式(re.compile())。
    • 避免過度復雜的正則表達式(如深層嵌套量詞)。
  • ?匹配失敗處理:檢查 Match 對象是否為 None 避免異常:

    python

    match = re.search(r'\d+', 'abc')
    if match:
        print(match.group())

6. 應用場景

  • ?數據提取:從日志、HTML、JSON 中提取特定字段。
  • ?輸入驗證:檢查郵箱、電話、密碼格式是否合法。
  • ?文本清洗:替換敏感詞、標準化日期格式。
  • ?復雜搜索:查找符合特定模式的字符串片段。

?7. 總結

  • ?核心功能re 模塊通過正則表達式實現(xiàn)高效的字符串模式操作。
  • ?常用函數match()、search()findall()、sub()split()。
  • ?匹配對象:利用 group()groups() 提取分組內容。
  • ?高級特性:非貪婪匹配、命名分組、預編譯優(yōu)化。

到此這篇關于python正則表達式標準庫之re庫的文章就介紹到這了,更多相關python re庫介紹內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • 手把手教你用Python中的Linting提高代碼質量

    手把手教你用Python中的Linting提高代碼質量

    Python是一種不斷發(fā)展的語言,隨著它的演化和擴展,可用工具和開發(fā)策略的數量也在增加,近來流行的一個過程是linting—檢查代碼的潛在問題,下面這篇文章主要給大家介紹了關于用Python中Linting提高代碼質量的相關資料,需要的朋友可以參考下
    2023-01-01
  • python基礎練習之幾個簡單的游戲

    python基礎練習之幾個簡單的游戲

    這篇文章主要介紹了python基礎練習之幾個簡單的游戲,具有一定參考價值,需要的朋友可以了解下。
    2017-11-11
  • Python學習思維導圖(必看篇)

    Python學習思維導圖(必看篇)

    下面小編就為大家?guī)硪黄狿ython學習思維導圖(必看篇)。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-06-06
  • Python format()格式化輸出方法

    Python format()格式化輸出方法

    這篇文章主要介紹了Python format()格式化輸出方法, Python 2.6以后,Python 中的就提供了字符串類型(str)提供了 format() 方法對字符串進行格式化,夏敏我們就來了解這個方法吧,需要的小伙伴也可以參考一下

    2021-12-12
  • flask循環(huán)導入的問題解決

    flask循環(huán)導入的問題解決

    循環(huán)導入是指兩個文件相互導入對,本文主要介紹了flask循環(huán)導入的問題解決,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-04-04
  • python將txt文件讀入為np.array的方法

    python將txt文件讀入為np.array的方法

    今天小編就為大家分享一篇python將txt文件讀入為np.array的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-10-10
  • 對python創(chuàng)建及引用動態(tài)變量名的示例講解

    對python創(chuàng)建及引用動態(tài)變量名的示例講解

    今天小編就為大家分享一篇對python創(chuàng)建及引用動態(tài)變量名的示例講解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-11-11
  • 基于python解析XML文件并將數據存儲到MongoDB的代碼示例

    基于python解析XML文件并將數據存儲到MongoDB的代碼示例

    在軟件開發(fā)中,我們經常需要處理各種格式的數據,XML 是一種常用的數據交換格式,它可以存儲和傳輸結構化數據,很多網站會提供 XML 格式的數據接口,以便其他系統(tǒng)可以方便地獲取數據,本文介紹了基于python解析XML文件并將數據存儲到MongoDB的代碼示例,需要的朋友可以參考下
    2024-06-06
  • Python裝飾器實現(xiàn)函數運行時間的計算

    Python裝飾器實現(xiàn)函數運行時間的計算

    這篇文章主要為大家詳細介紹了Python函數運行時間的計算,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2022-02-02
  • Python機器學習應用之樸素貝葉斯篇

    Python機器學習應用之樸素貝葉斯篇

    樸素貝葉斯模型是一組非常簡單快速的分類算法,通常適用于維度非常高的數據集。因為運行速度快,而且可調參數少,因此非常適合為分類問題提供快速粗糙的基本方案
    2022-01-01

最新評論