快捷導(dǎo)航

python如何通過(guò)正則匹配指定字符開頭與結(jié)束提取中間內(nèi)容

更新時(shí)間：2023年02月20日 14:58:59 作者：weixin_43890704

這篇文章主要介紹了python通過(guò)正則匹配指定字符開頭與結(jié)束提取中間內(nèi)容的操作方法，本文結(jié)合實(shí)例代碼給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下

一、提取包含始末字符

1、起始字符串固定

a = re.findall('起始字符串.*結(jié)束字符串',str)

2、起始字符串不固定（即從首字符串提取到固定的字符串結(jié)束），用^指定從首字符串開始

a = re.findall('^.*結(jié)束字符串',str)

二、不包含始末字符串

#方法1
a = re.findall('(?<=始字符串).*?(?=末字符串)',str)
#方法2
a = re.findall('始字符串(.*?)末字符串',str)

在 re.findall()的方法中 '始字符串.末字符串’ 可以匹配到相同的值直到最后一個(gè)值；如果參數(shù)為 '始字符串.?末字符串’則只匹配到第一個(gè)值。其實(shí)使用.*和.+都能提取特定始末字符串中間的內(nèi)容，下面順便說(shuō)下兩者的區(qū)別。

三、.*和.+正則提取的區(qū)別

.：匹配任意字符
*：匹配0個(gè)或多個(gè)字符
?：非貪婪模式，在符合的條件下，盡可能少的匹配(盡可能短的匹配)

str2 = "aabab"
a = re.findall('a.*?b',str2)	#結(jié)果：['aab', 'ab']
b = re.findall('a.+?b',str2)	#結(jié)果：['aab']

.?：匹配aab和ab ，因?yàn)榭梢云ヅ?個(gè)字符，所以可以匹配得到ab
.+?：匹配aab，因?yàn)?必須a和b中間至少有一個(gè)字符，所以排除了ab

四、起始有無(wú)^的區(qū)別

str2 = "aabab"
c = re.findall('.*',str2)	#結(jié)果：['aabab', '']
d = re.findall('^.*',str2)	#結(jié)果：['aabab']

五、pandas對(duì)具體列的內(nèi)容通過(guò)正則表達(dá)式進(jìn)行數(shù)據(jù)提取

1.使用前要確保該列的類型統(tǒng)一，str或者float格式，最好事先通過(guò)astype強(qiáng)制轉(zhuǎn)換一下

2.df[‘新列名’]=df[‘提取的列名’].str.extract(‘正則表達(dá)式’, expand = True)

六、遇到的報(bào)錯(cuò)

報(bào)錯(cuò)：pattern contains no capture groups
（翻譯：模式不包含捕獲組）
解決：根據(jù)docs ，您需要為 str.extract 指定一個(gè)捕獲組(即括號(hào))好，提取。

參考文章：

https://www.cnblogs.com/ZhangHT97/p/13427325.html
https://www.cnblogs.com/YouJeffrey/p/15209895.html

https://blog.csdn.net/dudu3332/article/details/111555572

到此這篇關(guān)于python通過(guò)正則匹配指定字符開頭與結(jié)束提取中間內(nèi)容的文章就介紹到這了,更多相關(guān)python正則匹配提取中間內(nèi)容內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

如何解決requests,已經(jīng)安裝卻無(wú)法import問(wèn)題
這篇文章主要介紹了如何解決requests,已經(jīng)安裝卻無(wú)法import問(wèn)題，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
2023-06-06
simple-pytest?框架使用教程
simple-pytest框架主要參考了httprunner的yaml數(shù)據(jù)驅(qū)動(dòng)部分設(shè)計(jì)思路,是基于Pytest?+?Pytest-html+?Log?+?Yaml?+?Mysql?實(shí)現(xiàn)的簡(jiǎn)易版接口自動(dòng)化框架，這篇文章主要介紹了simple-pytest?框架使用指南,需要的朋友可以參考下
2024-02-02
使用Python壓縮和解壓縮zip文件的教程
這篇文章主要介紹了使用Python壓縮和解壓縮zip文件的教程,主要用到了zipfile包,需要的朋友可以參考下
2015-05-05
淺析Python 多行匹配模式
這篇文章主要介紹了Python 多行匹配模式的相關(guān)資料，文中講解非常細(xì)致，代碼幫助大家更好的理解和學(xué)習(xí)，感興趣的朋友可以了解下
2020-07-07
python實(shí)現(xiàn)微信接口(itchat)詳細(xì)介紹
這篇文章主要介紹了python實(shí)現(xiàn)微信接口(itchat)詳細(xì)介紹，小編覺得挺不錯(cuò)的，這里分享給大家，供需要的朋友參考。
2017-10-10
今天小編就為大家分享一篇在python環(huán)境下運(yùn)用kafka對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)傳輸?shù)姆椒?，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2018-12-12