Python 正則表達(dá)式(?=...)和(?<=...)符號的使用
引言
今天遇到了一個比較棘手的問題,于是終于打算要對正則表達(dá)式中的 (?=...)
和 (?<=...)
符號動手了。
正文
(?=...)
表示當(dāng) …
匹配時,匹配成功,但不消耗字符串中的任何字符。這個叫做 前視斷言 (lookahead assertion)
。比如, Isaac (?=Asimov)
將會匹配 Isaac
,僅當(dāng)其后緊跟 Asimov
。
在之前的介紹中,為什么要使用 ()
符號以及 ...
符號的含義。事實上,上述的 (?=...)
與 (?<=...)
中的 ...
符號可以被替換為任意的符號,這里為了方便說明問題,我們將 ...
符號替換為 \t
符號。
示例1
import re str1 = 'abc\tdefghi\txyz' print(re.search('(?=\t)', str1)) """ result: <re.Match object; span=(3, 3), match=''> """
可以看到,它匹配到了索引值為 3
的 \t
字符,但是由于它是前視斷言,即向前搜索,而我們的匹配項中 (?=\t)
之前并沒有任何字符,因此什么也沒有匹配到。
示例2
我們對示例 1
中的匹配內(nèi)容稍作更改。
import re str1 = 'abc\tdefghi\txyz' print(re.search('abc(?=\t)', str1)) """ result: <re.Match object; span=(0, 3), match='abc'> """
此時可以看到,匹配到了字符串 abc
。
示例3
(?<=...)
表示如果 ...
的匹配內(nèi)容出現(xiàn)在當(dāng)前位置的左側(cè),則匹配。這叫做 肯定型后視斷言 (positive lookbehind assertion)
。 (?<=abc)def
將會在 abcdef
中找到一個匹配,因為后視會回退 3
個字符并檢查內(nèi)部表達(dá)式是否匹配。內(nèi)部表達(dá)式(匹配的內(nèi)容)必須是固定長度的,意思就是 abc
或 a|b
是允許的,但是 a*
和 a{3,4}
不可以。注意,以肯定型后視斷言開頭的正則表達(dá)式,匹配項一般不會位于搜索字符串的開頭。
上面的解釋比較抽象,那么具體是什么意思呢?我們看一個例子。
import re str1 = 'abc\tdefghi\txyz' print(re.search('(?<=\t)def', str1)) """ result: <re.Match object; span=(4, 7), match='def'> """
程序先找到 def
字符串,然后再回退一個字符查看 def
前面的字符是否是 \t
字符,如果是,那么就匹配 def
字符串。
示例4
如果我們想要匹配兩個 \t 字符中間的部分怎么辦呢?
import re str1 = 'abc\tdefghi\txyz' print(re.search('\t(.*)\t', str1)) """ result: <re.Match object; span=(3, 11), match='\tdefghi\t'> """
可以看到,此時,結(jié)果中包含了兩端的 \t
字符,但是我們不想要它包含 \t
字符。為了實現(xiàn)這一目標(biāo),我們可以采用剛才我們提到的后視和前視。
import re str1 = 'abc\tdefghi\txyz' print(re.search('(?<=\t).*(?=\t)', str1)) """ result: <re.Match object; span=(4, 10), match='defghi'> """
可以看到我們匹配到了兩個 \t
字符中間的字符串,但是上述寫法并不嚴(yán)謹(jǐn),為了嚴(yán)謹(jǐn),我們可以使用:
import re str1 = 'abc\tdefghi\txyz' print(re.search('(?<=\t)(.*)(?=\t)', str1)) """ result: <re.Match object; span=(4, 10), match='defghi'> """
到此這篇關(guān)于Python 正則表達(dá)式(?=...)和(?<=...)符號的使用的文章就介紹到這了,更多相關(guān)Python ?=... ?<=... 內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
關(guān)于使用Python的time庫制作進(jìn)度條程序
這篇文章主要介紹了關(guān)于使用Python的time庫制作進(jìn)度條程序,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-04-04python GUI庫圖形界面開發(fā)之PyQt5結(jié)合Qt Designer創(chuàng)建信號與槽的詳細(xì)方法與實例
這篇文章主要介紹了python GUI庫圖形界面開發(fā)之PyQt5結(jié)合Qt Designer創(chuàng)建信號與槽的詳細(xì)方法與實例,需要的朋友可以參考下2020-03-03python中pip安裝庫時出現(xiàn)Read?timed?out解決辦法
最近需要使用pip庫,安裝的時候出現(xiàn)問題,本文就詳細(xì)的介紹一下python中pip安裝庫時出現(xiàn)Read?timed?out解決辦法,具有一定的參考價值,感興趣的可以了解一下2022-03-03