亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python re.sub 反向引用的實現(xiàn)

 更新時間:2021年07月07日 14:00:24   作者:Tsonglew  
反向引用指的是在指定替換結(jié)果的過程中,可以引用原始字符串中的匹配到內(nèi)容,本文主要介紹了反向引用的設(shè)置方法,感興趣的可以了解一下

re 模塊是 Python 標準庫中提供的用于處理正則表達式的模塊,利用 re 模塊可以方便的利用正則表達式實現(xiàn)字符串中的匹配、替換等操作

match 分組

Python re 模塊中提供了 match 函數(shù),用來匹配字符串中指定的正則表達式規(guī)則。例如,如果想匹配到 "Isaac Newton, physicist" 中的 Isaac Newton,則可以使用正則表達式 \w+ \w+ ,運行結(jié)果如下:

>>> m = re.match("\w+ \w+", "Isaac Newton, physicist")
>>> m
<re.Match object; span=(0, 12), match='Isaac Newton'>

re.match 的第一個參數(shù)是指定的正則表達式規(guī)則,第二個參數(shù)是待匹配的字符串。正則表達式規(guī)則 \w+ 表示匹配一段連續(xù)的字符,要求匹配到的字符數(shù)量大于 1。 \w+ \w+ 就表示匹配兩段連續(xù)的字符,且兩段字符中間用空格隔開

使用 match 執(zhí)行匹配時會對匹配到的結(jié)果進行 分組 ,可以通過 match 返回結(jié)果的 group() 接口查看分組結(jié)果

>>> m.group(0)
'Isaac Newton'

默認情況下, match 只會產(chǎn)生一個分組,就是第 0 個分組,表示整個匹配到的內(nèi)容。對于上面的例子,第 0 個分組就是 \w+ \w+ 匹配到的完整的內(nèi)容,也就是 Issac Newton 。
使用正則表達式中的括號 () 可以手動指定匹配的分組。例如如果想把 Issac 和 Newton 做為兩個分組,那么可以將正則表達式改為 (\w+) (\w+) :

>>> m = re.match("(\w+) (\w+)", "Isaac Newton, physicist")

在 (\w+) (\w+) 這個正則表達式中,指定了兩個分組,這兩個分組匹配的內(nèi)容都是 \w+ ,并且兩個分組之間用空格隔開。
使用 groups() 可以查看匹配結(jié)果中的所有分組 :

>>> m.groups()
('Isaac', 'Newton')

也可以使用 group() 接口分別查看每一個分組,其中 group(0) 仍然表示完整的匹配結(jié)果, group(1) 表示匹配結(jié)果中的第 1 個分組, group(2) 表示第 2 個分組,以此類推:

>>> m.group(0)
'Isaac Newton'
>>> m.group(1)
'Isaac'
>>> m.group(2)
'Newton'

re.sub 匹配和替換

re.match() 函數(shù)提供了正則表達式的匹配接口, re.sub() 不光能匹配正則表達式,還能替換字符串中的結(jié)果,生成一個新的字符串。
例如把字符串中 (\w+) (\w+) 匹配到的結(jié)果替換成 Albert Einstein ,可以這樣寫:

>>> re.sub("(\w+) (\w+)", "Albert Einstein", "Isaac Newton, physicist")
'Albert Einstein, physicist'

re.sub 中第 1 個參數(shù)表示匹配的正則表達式,第 2 個參數(shù)表示替換表達式,第 3 個參數(shù)表示原始字符串

這里的替換表達式是手動指定的新字符串 Albert Einstein ,他和原始字符串中的內(nèi)容毫不相關(guān)。如果希望復(fù)用原始字符串中的內(nèi)容,那么就需要用到 re.sub 的反向引用功能了。

反向引用

反向引用指的是在指定替換結(jié)果的過程中,可以引用原始字符串中的匹配到內(nèi)容。例如 (\w+) (\w+) 在原始字符串中匹配到了 Isaac Newton ,利用匹配到的結(jié)果,將結(jié)果改寫為 FirstName: Isaac, LastName: Newton 。
既然需要引用,那么就得有一個表達式能夠表示匹配的內(nèi)容。恰好 re.sub 的匹配結(jié)果也有和 re.match 一樣的分組,因此只需要在替換表達式中引用分組的結(jié)果即可。引用方式有以下幾種:

  • \number :例如 \1 ,表示匹配結(jié)果中第 1 個分組,也就是例子中的 Isaac 部分。
  • \g<number> :例如 \g<1> ,和 \number 表示法一樣,也代表了匹配結(jié)果中的第 1 個分組。與 \number 表示法相比, \g<number> 避免了歧義。試想,如果想用 \number 把第 1 個分組匹配到的  Isaac 替換為 Isaac0 ,那么需要用 \10 ,這里本意表示在第 1 個分組后加上 0 ,但程序會識別成第 10 個分組。而使用 \g<number> 只需要寫成 \g<1>0 即可。

回到開始的例子中,將匹配結(jié)果 Isaac Newton改寫為 FirstName: Isaac, LastName: Newton ,可以用以下表達式實現(xiàn):

>>> re.sub("(\w+) (\w+)", "FirstName: \g<1>, LastName: \g<2>", "Isaac Newton, physicist")
'FirstName: Isaac, LastName: Newton, physicist'

參考

 re — Regular expression operations
 Python re(gex)? -- Groupings and backreferences

到此這篇關(guān)于Python re.sub 反向引用的實現(xiàn)的文章就介紹到這了,更多相關(guān)Python re.sub 反向引用內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家! 

相關(guān)文章

  • python實現(xiàn)會員信息管理系統(tǒng)(List)

    python實現(xiàn)會員信息管理系統(tǒng)(List)

    這篇文章主要為大家詳細介紹了python實現(xiàn)會員信息管理系統(tǒng),文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-03-03
  • 解決pycharm 安裝numpy失敗的問題

    解決pycharm 安裝numpy失敗的問題

    今天小編就為大家分享一篇解決pycharm 安裝numpy失敗的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12
  • django restframework serializer 增加自定義字段操作

    django restframework serializer 增加自定義字段操作

    這篇文章主要介紹了django restframework serializer 增加自定義字段操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-07-07
  • 淺談Python類的__getitem__和__setitem__特殊方法

    淺談Python類的__getitem__和__setitem__特殊方法

    下面小編就為大家?guī)硪黄獪\談Python類的__getitem__和__setitem__特殊方法。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2016-12-12
  • Tensorflow tf.nn.depthwise_conv2d如何實現(xiàn)深度卷積的

    Tensorflow tf.nn.depthwise_conv2d如何實現(xiàn)深度卷積的

    這篇文章主要介紹了Tensorflow tf.nn.depthwise_conv2d如何實現(xiàn)深度卷積的,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-04-04
  • Python機器學(xué)習(xí)應(yīng)用之基于線性判別模型的分類篇詳解

    Python機器學(xué)習(xí)應(yīng)用之基于線性判別模型的分類篇詳解

    線性判別分析(Linear?Discriminant?Analysis,?LDA)是一種監(jiān)督學(xué)習(xí)的降維方法,也就是說數(shù)據(jù)集的每個樣本是有類別輸出。和之前介紹的機器學(xué)習(xí)降維之主成分分析(PCA)方法不同,PCA是不考慮樣本類別輸出的無監(jiān)督學(xué)習(xí)方法
    2022-01-01
  • python3爬蟲中多線程進行解鎖操作實例

    python3爬蟲中多線程進行解鎖操作實例

    在本篇文章里小編給大家整理了關(guān)于python3爬蟲中多線程進行解鎖操作實例內(nèi)容,需要的朋友們可以參考下。
    2020-11-11
  • python?import模塊時有錯誤紅線的原因

    python?import模塊時有錯誤紅線的原因

    這篇文章主要介紹了python?import模塊時有錯誤紅線的原因及解決,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-02-02
  • python正則表達式實現(xiàn)自動化編程

    python正則表達式實現(xiàn)自動化編程

    這篇文章主要介紹了python正則表達式實現(xiàn)自動化編程,re模塊的compile()方法是構(gòu)成正則表達式的方法,向compile()傳入一個字符串表示正則表達式,該方法返回一個Regex模式的對象,需要的朋友可以參考下
    2023-01-01
  • tensorflow之變量初始化(tf.Variable)使用詳解

    tensorflow之變量初始化(tf.Variable)使用詳解

    今天小編就為大家分享一篇tensorflow之變量初始化(tf.Variable)使用詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-02-02

最新評論