快捷導(dǎo)航

python正則表達式標準庫之re庫的詳細介紹

更新時間：2025年06月30日 10:54:24 作者：wanglaqqqq

Python的re庫是用于處理正則表達式的標準庫,正則表達式是一種強大而靈活的文本處理工具,能夠幫助你執(zhí)行復(fù)雜的字符串匹配和替換操作,這篇文章主要介紹了python正則表達式標準庫之re庫的詳細介紹,需要的朋友可以參考下

1. 模塊概述

re 是 Python 標準庫中用于正則表達式操作的模塊，提供字符串的復(fù)雜模式匹配、搜索、替換等功能。正則表達式（Regex）通過特定語法規(guī)則描述字符串模式，適用于文本解析、數(shù)據(jù)清洗、輸入驗證等場景。

2. 核心概念

?(1) 正則表達式語法

?普通字符：如 a、1 直接匹配自身。
?特殊字符：
- .：匹配任意字符（除換行符，除非啟用 re.DOTALL）。
- ^：匹配字符串開頭。
- $：匹配字符串結(jié)尾。
- \d：匹配數(shù)字（等價于 [0-9]）。
- \w：匹配字母、數(shù)字、下劃線（等價于 [a-zA-Z0-9_]）。
- \s：匹配空白符（空格、制表符、換行等）。
- []：字符集合（如 [a-z] 匹配小寫字母）。
- |：邏輯或（如 a|b 匹配 a 或 b）。
?量詞：
- *：匹配前一個字符 0 次或多次。
- +：匹配前一個字符 1 次或多次。
- ?：匹配前一個字符 0 次或 1 次。
- {m}：匹配前一個字符恰好 m 次。
- {m,n}：匹配前一個字符 m 到 n 次。
?分組與捕獲：
- ()：定義捕獲組（可通過索引或命名引用）。
- (?:)：非捕獲組（僅分組，不捕獲）。

?(2) 修飾符（Flags）?

修飾符	描述
`re.IGNORECASE` (或 `re.I`)	忽略大小寫
`re.MULTILINE` (或 `re.M`)	多行模式（`^` 和 `$` 匹配每行的開頭/結(jié)尾）
`re.DOTALL` (或 `re.S`)	`.` 匹配包括換行符在內(nèi)的所有字符
`re.VERBOSE` (或 `re.X`)	允許正則表達式換行并添加注釋

?3. 常用函數(shù)與示例

?(1) 匹配與搜索

函數(shù)	描述	示例
`re.match(pattern, string)`	?從字符串開頭匹配模式，成功返回 `Match` 對象，否則返回 `None`。	`re.match(r'\d+', '123abc') → Match 對象（匹配 '123'）`
`re.search(pattern, string)`	?掃描整個字符串查找第一個匹配，成功返回 `Match` 對象，否則返回 `None`。	`re.search(r'\d+', 'abc123def') → Match 對象（匹配 '123'）`
`re.findall(pattern, string)`	返回所有非重疊匹配的列表（直接返回字符串或元組列表）。	`re.findall(r'\d+', 'a1b22c333') → ['1', '22', '333']`
`re.finditer(pattern, string)`	返回所有匹配的迭代器，每個元素是 `Match` 對象。	`[m.group() for m in re.finditer(r'\d+', 'a1b22')] → ['1', '22']`

示例代碼：

import re

text = "Email: user@example.com, Phone: 123-456-7890"
# 提取郵箱
email = re.search(r'\w+@\w+\.\w+', text).group()  # 'user@example.com'
# 提取所有電話號碼片段
phones = re.findall(r'\d{3}-\d{3}-\d{4}', text)   # ['123-456-7890']

(2) 替換與分割

函數(shù)	描述	示例
`re.sub(pattern, repl, string)`	將匹配模式的部分替換為 `repl`，返回新字符串。	`re.sub(r'\d+', '#', 'a1b22c') → 'a#b#c'`
`re.split(pattern, string)`	按模式分割字符串，返回列表。	`re.split(r'\W+', 'Hello, world!') → ['Hello', 'world', '']`

示例代碼：

# 替換日期格式（YYYY-MM-DD → DD/MM/YYYY）
date = "2023-10-05"
new_date = re.sub(r'(\d{4})-(\d{2})-(\d{2})', r'\3/\2/\1', date)  # '05/10/2023'

# 分割復(fù)雜文本
text = "apple,,banana;;cherry"
parts = re.split(r'[,;]+', text)  # ['apple', 'banana', 'cherry']

(3) 預(yù)編譯正則表達式

使用 re.compile() 預(yù)編譯正則表達式以提高效率（尤其需多次使用同一模式時）：

pattern = re.compile(r'\d+')
match = pattern.match('123abc')  # 等效于 re.match(r'\d+', '123abc')

(4) 匹配對象（Match Object）?

成功匹配后返回的 Match 對象提供以下方法：

方法	描述
`group(n)`	返回第 `n` 個分組（默認 `n=0` 表示整個匹配）。
`groups()`	返回所有分組的元組。
`start()` / `end()`	返回匹配的起始/結(jié)束索引。
`span()`	返回匹配的索引范圍元組 `(start, end)`。

示例：

text = "Date: 2023-10-05"
match = re.search(r'(\d{4})-(\d{2})-(\d{2})', text)
if match:
    print(match.group(0))   # '2023-10-05'
    print(match.group(1))   # '2023'
    print(match.groups())   # ('2023', '10', '05')
    print(match.span(1))    # (6, 10)

4. 高級技巧

?(1) 非貪婪匹配

默認量詞（如 *, +）是貪婪的（盡可能多匹配），添加 ? 可改為非貪婪模式：

# 貪婪匹配
re.findall(r'<.*>', '<div>text</div>')  # ['<div>text</div>']
# 非貪婪匹配
re.findall(r'<.*?>', '<div>text</div>') # ['<div>', '</div>']

(2) 命名分組

使用 (?P<name>...) 定義命名分組，通過 group('name') 訪問：

text = "ID: 123, Name: Alice"
match = re.search(r'ID: (?P<id>\d+), Name: (?P<name>\w+)', text)
print(match.group('id'))    # '123'
print(match.group('name'))  # 'Alice'

5. 常見問題與注意事項

?轉(zhuǎn)義字符：在正則表達式中使用 \ 需寫成 \\，或使用原始字符串 r'' 簡化：

python

re.match(r'\d+', '123')    # 正確（原始字符串）
re.match('\\d+', '123')    # 正確（常規(guī)字符串需轉(zhuǎn)義）

?性能優(yōu)化：
- 多次使用同一模式時，預(yù)編譯正則表達式（re.compile()）。
- 避免過度復(fù)雜的正則表達式（如深層嵌套量詞）。
?匹配失敗處理：檢查 Match 對象是否為 None 避免異常：

python
```
match = re.search(r'\d+', 'abc')
if match:
    print(match.group())
```

6. 應(yīng)用場景

?數(shù)據(jù)提取：從日志、HTML、JSON 中提取特定字段。
?輸入驗證：檢查郵箱、電話、密碼格式是否合法。
?文本清洗：替換敏感詞、標準化日期格式。
?復(fù)雜搜索：查找符合特定模式的字符串片段。

?7. 總結(jié)

?核心功能：re 模塊通過正則表達式實現(xiàn)高效的字符串模式操作。
?常用函數(shù)：match()、search()、findall()、sub()、split()。
?匹配對象：利用 group()、groups() 提取分組內(nèi)容。
?高級特性：非貪婪匹配、命名分組、預(yù)編譯優(yōu)化。

到此這篇關(guān)于python正則表達式標準庫之re庫的文章就介紹到這了,更多相關(guān)python re庫介紹內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python正則表達式標準庫之re庫的詳細介紹

目錄

1. 模塊概述

2. 核心概念

?(1) 正則表達式語法

?(2) 修飾符（Flags）?

?3. 常用函數(shù)與示例

?(1) 匹配與搜索

(2) 替換與分割

(3) 預(yù)編譯正則表達式

(4) 匹配對象（Match Object）?

4. 高級技巧

?(1) 非貪婪匹配

(2) 命名分組

5. 常見問題與注意事項

6. 應(yīng)用場景

?7. 總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python正則表達式標準庫之re庫的詳細介紹

目錄

1. 模塊概述

2. 核心概念

?**(1) 正則表達式語法**

?**(2) 修飾符（Flags）?**

?3. 常用函數(shù)與示例

?**(1) 匹配與搜索**

**(2) 替換與分割**

**(3) 預(yù)編譯正則表達式**

**(4) 匹配對象（Match Object）?**

4. 高級技巧

?**(1) 非貪婪匹配**

**(2) 命名分組**

5. 常見問題與注意事項

6. 應(yīng)用場景

?7. 總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

?(1) 正則表達式語法

?(2) 修飾符（Flags）?

?(1) 匹配與搜索

(2) 替換與分割

(3) 預(yù)編譯正則表達式

(4) 匹配對象（Match Object）?

?(1) 非貪婪匹配

(2) 命名分組