python 正則表達(dá)式 re.sub & re.subn
python正則表達(dá)式模塊簡(jiǎn)介
Python 自1.5版本起增加了re 模塊,它提供 Perl 風(fēng)格的正則表達(dá)式模式。Python 1.5之前版本則是通過(guò) regex 模塊提供 Emacs 風(fēng)格的模式。Emacs 風(fēng)格模式可讀性稍差些,而且功能也不強(qiáng),因此編寫(xiě)新代碼時(shí)盡量不要再使用 regex 模塊,當(dāng)然偶爾你還是可能在老代碼里發(fā)現(xiàn)其蹤影。
就其本質(zhì)而言,正則表達(dá)式(或 RE)是一種小型的、高度專(zhuān)業(yè)化的編程語(yǔ)言,(在Python中)它內(nèi)嵌在Python中,并通過(guò) re 模塊實(shí)現(xiàn)。使用這個(gè)小型語(yǔ)言,你可以為想要匹配的相應(yīng)字符串集指定規(guī)則;該字符串集可能包含英文語(yǔ)句、e-mail地址、TeX命令或任何你想搞定的東西。然后你可以問(wèn)諸如“這個(gè)字符串匹配該模式嗎?”或“在這個(gè)字符串中是否有部分匹配該模式呢?”。你也可以使用 RE 以各種方式來(lái)修改或分割字符串。
正則表達(dá)式模式被編譯成一系列的字節(jié)碼,然后由用 C 編寫(xiě)的匹配引擎執(zhí)行。在高級(jí)用法中,也許還要仔細(xì)留意引擎是如何執(zhí)行給定 RE ,如何以特定方式編寫(xiě) RE 以令生產(chǎn)的字節(jié)碼運(yùn)行速度更快。本文并不涉及優(yōu)化,因?yàn)槟且竽阋殉浞终莆樟似ヅ湟娴膬?nèi)部機(jī)制。
正則表達(dá)式語(yǔ)言相對(duì)小型和受限(功能有限),因此并非所有字符串處理都能用正則表達(dá)式完成。當(dāng)然也有些任務(wù)可以用正則表達(dá)式完成,不過(guò)最終表達(dá)式會(huì)變得異常復(fù)雜。碰到這些情形時(shí),編寫(xiě) Python 代碼進(jìn)行處理可能反而更好;盡管 Python 代碼比一個(gè)精巧的正則表達(dá)式要慢些,但它更易理解。
正則表達(dá)式一個(gè)比較常見(jiàn)的用途是找到所有模式匹配的字符串并用不同的字符串來(lái)替換它們。sub方法提供一個(gè)替換值,可以是字符串或函數(shù),和一個(gè)要被處理的字符串。
Grammar:
re.sub(pattern, repl, string[, count])
使用repl替換string中每一個(gè)匹配的子串后返回替換后的字符串。
當(dāng)repl是一個(gè)字符串時(shí),可以使用\id或\g、\g引用分組,但不能使用編號(hào)0。
當(dāng)repl是一個(gè)方法時(shí),這個(gè)方法應(yīng)當(dāng)只接受一個(gè)參數(shù)(Match對(duì)象),并返回一個(gè)字符串用于替換(返回的字符串中不能再引用分組)。
count用于指定最多替換次數(shù),不指定時(shí)全部替換。
re.subn(pattern, repl, string[, count])
返回 (sub(repl, string[, count]), 替換次數(shù))。
Case:
#coding=utf-8 import re str = "https://i.cnb1logs.co2m/Edi3tPosts.asp4x?opt=999" pattern=re.compile(r'(\.)') print '\. :' ,re.sub(pattern,'-',str) pattern=re.compile(r'\/([^*]+)\/') print '\/([^*]+)\/ :' ,re.sub(pattern,r'<em>\1<em>',str) pattern = re.compile(r'(\w+)(\w+)(\d+)') #先切片測(cè)試 print re.split(pattern,str) print re.sub(pattern,r'\3 \1',str) #subn統(tǒng)計(jì)sub替換次數(shù) print re.subn(pattern,r'\3 \1',str)
Output
\. : https://i-cnb1logs-co2m/Edi3tPosts-asp4x?opt=999 \/([^*]+)\/ : https:<em>/i.cnb1logs.co2m<em>Edi3tPosts.asp4x?opt=999 ['https://i.', 'cn', 'b', '1', 'logs.', 'c', 'o', '2', 'm/', 'Ed', 'i', '3', 'tPosts.', 'as', 'p', '4', 'x?opt=', '9', '9', '9', ''] https://i.1 cnlogs.2 cm/3 EdtPosts.4 asx?opt=9 9 ('https://i.1 cnlogs.2 cm/3 EdtPosts.4 asx?opt=9 9', 5) ***Repl Closed***
總結(jié)
相關(guān)文章
Javascript 字符串字節(jié)長(zhǎng)度計(jì)算函數(shù)代碼與效率分析(for VS 正則)
下面的函數(shù)都是用于計(jì)算字符串長(zhǎng)度,英文算一個(gè),中文算兩個(gè)。效果一樣,效率卻未必一樣,大家可以自行選擇下。2009-12-12javascript中10個(gè)正則表達(dá)式使用介紹基礎(chǔ)篇
本文通過(guò)舉例簡(jiǎn)單的介紹了正則表達(dá)式的一些使用方法,能夠助力你快速入門(mén)正則表達(dá)式,希望這篇正則總結(jié)方法能對(duì)你有用2020-02-02PHP 正則表達(dá)式驗(yàn)證中文的問(wèn)題
PHP 正則表達(dá)式驗(yàn)證中文的問(wèn)題,感覺(jué)php不支持perl轉(zhuǎn)義挺討厭的。2009-08-08layui 正則表達(dá)式驗(yàn)證使用實(shí)例詳解
layui的正則表達(dá)式是在form表單中完成的,這篇文章主要介紹了layui 正則表達(dá)式驗(yàn)證使用教程,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-04-04JS中的正則表達(dá)式及pattern的注意事項(xiàng)
本文給大家介紹js中的正則表達(dá)式的注意事項(xiàng)以及pattern的注意事項(xiàng),需要的小伙伴可以參考下本篇文章2015-10-10