亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python3正則模塊re的使用方法詳解

 更新時(shí)間:2020年02月11日 16:11:56   作者:paul0926  
這篇文章主要介紹了python3正則模塊re的使用方法詳解,需要的朋友可以參考下

一、正則

1.正則表達(dá)式定義

正則就是用一些具有特殊含義的符號(hào)組合到一起(稱(chēng)為正則表達(dá)式)來(lái)描述字符或者字符串的方法?;蛘哒f(shuō):正則就是用來(lái)描述一類(lèi)事物的規(guī)則。(在Python中)它內(nèi)嵌在Python中,并通過(guò) re 模塊實(shí)現(xiàn)。正則表達(dá)式模式被編譯成一系列的字節(jié)碼,然后由用 C 編寫(xiě)的匹配引擎執(zhí)行。

2.目的和特點(diǎn)

給定一個(gè)正則表達(dá)式和另一個(gè)字符串,我們可以達(dá)到如下的目的:

給定的字符串是否符合正則表達(dá)式的過(guò)濾邏輯(稱(chēng)作“匹配”):

可以通過(guò)正則表達(dá)式,從字符串中獲取我們想要的特定部分。

正則表達(dá)式的特點(diǎn)是:

靈活性、邏輯性和功能性非常強(qiáng);

可以迅速地用極簡(jiǎn)單的方式達(dá)到字符串的復(fù)雜控制。

由于正則表達(dá)式主要應(yīng)用對(duì)象是文本,因此它在各種文本編輯器場(chǎng)合都有應(yīng)用,小到著名編輯器EditPlus,大到Microsoft Word、Visual Studio等大型編輯器,都可以使用正則表達(dá)式來(lái)處理文本內(nèi)容。

3.常用的正則表達(dá)式

4.貪婪模式與非貪婪模式

正則表達(dá)式通常用于在文本中查找匹配的字符串。Python里數(shù)量詞默認(rèn)是貪婪的(在少數(shù)語(yǔ)言里也可能是默認(rèn)非貪婪),總是嘗試匹配盡可能多的字符;非貪婪的則相反,總是嘗試匹配盡可能少的字符。例如:正則表達(dá)式"ab*“如果用于查找"abbbc”,將找到"abbb"。而如果使用非貪婪的數(shù)量詞"ab*?",將找到"a"。

5.反斜杠

與大多數(shù)編程語(yǔ)言相同,正則表達(dá)式里使用"“作為轉(zhuǎn)義字符,這就可能造成反斜杠困擾。假如你需要匹配文本中的字符”",那么使用編程語(yǔ)言表示的正則表達(dá)式里將需要4個(gè)反斜杠"\\":前兩個(gè)和后兩個(gè)分別用于在編程語(yǔ)言里轉(zhuǎn)義成反斜杠,轉(zhuǎn)換成兩個(gè)反斜杠后再在正則表達(dá)式里轉(zhuǎn)義成一個(gè)反斜杠。Python里的原生字符串很好地解決了這個(gè)問(wèn)題,這個(gè)例子中的正則表達(dá)式可以使用r"\“表示。同樣,匹配一個(gè)數(shù)字的”\d"可以寫(xiě)成r"\d"。有了原生字符串,你再也不用擔(dān)心是不是漏寫(xiě)了反斜杠,寫(xiě)出來(lái)的表達(dá)式也更直觀。

二、python3正則模塊re

1.match

match(string[, pos[, endpos]]) | re.match(pattern, string[, flags]):

Match對(duì)象是一次匹配的結(jié)果,包含了很多關(guān)于此次匹配的信息,可以使用Match提供的可讀屬性或方法來(lái)獲取這些信息。

屬性:

string: 匹配時(shí)使用的文本。

re: 匹配時(shí)使用的Pattern對(duì)象。

pos: 文本中正則表達(dá)式開(kāi)始搜索的索引。值與Pattern.match()和Pattern.seach()方法的同名參數(shù)相同。

endpos: 文本中正則表達(dá)式結(jié)束搜索的索引。值與Pattern.match()和Pattern.seach()方法的同名參數(shù)相同。

lastindex: 最后一個(gè)被捕獲的分組在文本中的索引。如果沒(méi)有被捕獲的分組,將為None。

lastgroup: 最后一個(gè)被捕獲的分組的別名。如果這個(gè)分組沒(méi)有別名或者沒(méi)有被捕獲的分組,將為None。

方法:

group([group1, …])

獲得一個(gè)或多個(gè)分組截獲的字符串;指定多個(gè)參數(shù)時(shí)將以元組形式返回。group1可以使用編號(hào)也可以使用別名;編號(hào)0代表整個(gè)匹配的子串;不填寫(xiě)參數(shù)時(shí),返回group(0);沒(méi)有截獲字符串的組返回None;截獲了多次的組返回最后一次截獲的子串。

groups([default])

以元組形式返回全部分組截獲的字符串。相當(dāng)于調(diào)用group(1,2,…last)。default表示沒(méi)有截獲字符串的組以這個(gè)值替代,默認(rèn)為None。

groupdict([default])

返回以有別名的組的別名為鍵、以該組截獲的子串為值的字典,沒(méi)有別名的組不包含在內(nèi)。default含義同上。

start([group])

返回指定的組截獲的子串在string中的起始索引(子串第一個(gè)字符的索引)。group默認(rèn)值為0。

end([group])

返回指定的組截獲的子串在string中的結(jié)束索引(子串最后一個(gè)字符的索引+1)。group默認(rèn)值為0。

span([group])

返回(start(group), end(group))。

expand(template)

將匹配到的分組代入template中然后返回。template中可以使用\id或\g、\g引用分組,但不能使用編號(hào)0。\id與\g是等價(jià)的;但\10將被認(rèn)為是第10個(gè)分組,如果你想表達(dá)\1之后是字符'0',只能使用\g<1>0。

import re
ret1 = re.match('t.{6}w', 'taaa333w123')
try:
  print('匹配到的數(shù)據(jù)是:', ret1.group()) # 匹配的是一個(gè)group
except:
  print('沒(méi)有匹配到數(shù)據(jù)')

2.search

search(string[, pos[, endpos]]) | re.search(pattern, string[,flags])

這個(gè)方法用于查找字符串中可以匹配成功的子串。從string的pos下標(biāo)處起嘗試匹配pattern,如果pattern結(jié)束時(shí)仍可匹配,則返回一個(gè)Match對(duì)象;若無(wú)法匹配,則將pos加1后重新嘗試匹配;直到pos=endpos時(shí)仍無(wú)法匹配則返回None。

pos和endpos的默認(rèn)值分別為0和len(string));re.search()無(wú)法指定這兩個(gè)參數(shù),參數(shù)flags用于編譯pattern時(shí)指定匹配模式。

ret5 = re.search('^[0-9].*', '1hello python') # ^代表以什么開(kāi)頭
print(ret5.group())

3.split,findall,finditer三個(gè)方法

  • split(string[, maxsplit]) | re.split(pattern, string[, maxsplit])
  • findall(string[, pos[, endpos]]) | re.findall(pattern, string[, flags])
  • finditer(string[, pos[, endpos]]) | re.finditer(pattern, string[, flags])

split類(lèi)似string中的split方法,不多解釋

findall()方法搜索string,以列表形式返回全部能匹配的子串。 實(shí)例:

import re
p = re.compile(r'\d+')
print(p.findall('one1two2three3four4'))

輸出

['1', '2', '3', '4']

finditer()方法搜索string,返回一個(gè)順序訪(fǎng)問(wèn)每一個(gè)匹配結(jié)果(Match對(duì)象)的迭代器。實(shí)例:

import re
p = re.compile(r'\d+')
for m in p.finditer('one1two2three3four4'):
  print(m.group(),)

輸出

1
2
3
4

4.sub

sub(repl, string[, count]) | re.sub(pattern, repl, string[, count])

使用repl替換string中每一個(gè)匹配的子串后返回替換后的字符串。

當(dāng)repl是一個(gè)字符串時(shí),可以使用\id或\g、\g引用分組,但不能使用編號(hào)0。

當(dāng)repl是一個(gè)方法時(shí),這個(gè)方法應(yīng)當(dāng)只接受一個(gè)參數(shù)(Match對(duì)象),并返回一個(gè)字符串用于替換(返回的字符串中不能再引用分組)。

count用于指定最多替換次數(shù),不指定時(shí)全部替換。

import re
p = re.compile(r'(\w+) (\w+)')
s = 'i say, hello world!'
print(p.sub(r'\2 \1', s))
def func(m):
  return m.group(1).title() + ' ' + m.group(2).title()
print(p.sub(func, s))

輸出

say i, world hello!

更多關(guān)于python3正則模塊re的使用方法請(qǐng)查看下面的相關(guān)鏈接

相關(guān)文章

  • Python 如何操作 SQLite 數(shù)據(jù)庫(kù)

    Python 如何操作 SQLite 數(shù)據(jù)庫(kù)

    這篇文章主要介紹了Python 如何操作 SQLite 數(shù)據(jù)庫(kù),幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下
    2020-08-08
  • 在Python中操作字典之update()方法的使用

    在Python中操作字典之update()方法的使用

    這篇文章主要介紹了在Python中操作字典之update()方法的使用,是Python入門(mén)學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下
    2015-05-05
  • python生成器在讀取接口用例中應(yīng)用解析

    python生成器在讀取接口用例中應(yīng)用解析

    這篇文章主要為大家介紹了python生成器在讀取接口用例中應(yīng)用解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-06-06
  • 利用django+wechat-python-sdk 創(chuàng)建微信服務(wù)器接入的方法

    利用django+wechat-python-sdk 創(chuàng)建微信服務(wù)器接入的方法

    今天小編就為大家分享一篇利用django+wechat-python-sdk 創(chuàng)建微信服務(wù)器接入的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟小編過(guò)來(lái)看看吧
    2019-02-02
  • Python安裝tar.gz格式文件方法詳解

    Python安裝tar.gz格式文件方法詳解

    這篇文章主要介紹了Python安裝tar.gz格式文件方法詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-01-01
  • python 等差數(shù)列末項(xiàng)計(jì)算方式

    python 等差數(shù)列末項(xiàng)計(jì)算方式

    這篇文章主要介紹了python 等差數(shù)列末項(xiàng)計(jì)算方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-05-05
  • 深入了解Python中的變量

    深入了解Python中的變量

    這篇文章主要為大家介紹了Python的變量,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助
    2021-12-12
  • python寫(xiě)入中英文字符串到文件的方法

    python寫(xiě)入中英文字符串到文件的方法

    這篇文章主要介紹了python寫(xiě)入中英文字符串到文件的方法,實(shí)例分析了Python操作中英文字符串的技巧,非常簡(jiǎn)單實(shí)用,需要的朋友可以參考下
    2015-05-05
  • python實(shí)現(xiàn)PID溫控算法的示例代碼

    python實(shí)現(xiàn)PID溫控算法的示例代碼

    PID算法是一種常用的控制算法,用于調(diào)節(jié)和穩(wěn)定控制系統(tǒng)的輸出,這篇文章主要為大家詳細(xì)介紹了如何使用Python實(shí)現(xiàn)pid溫控算法,需要的可以參考下
    2024-01-01
  • 使用python實(shí)現(xiàn)一個(gè)簡(jiǎn)單的圖片爬蟲(chóng)

    使用python實(shí)現(xiàn)一個(gè)簡(jiǎn)單的圖片爬蟲(chóng)

    在本文中,我們將學(xué)習(xí)如何使用Python創(chuàng)建一個(gè)簡(jiǎn)單的圖片爬蟲(chóng),我們將利用requests庫(kù)來(lái)發(fā)送HTTP請(qǐng)求,BeautifulSoup庫(kù)來(lái)解析HTML頁(yè)面,以及os和shutil庫(kù)來(lái)下載和保存圖片,通過(guò)這個(gè)教程,你將學(xué)會(huì)如何爬取網(wǎng)頁(yè)上的圖片并保存到本地,需要的朋友可以參考下
    2024-02-02

最新評(píng)論