亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python正則表達(dá)式基本原理

 更新時(shí)間:2023年04月09日 10:37:20   作者:愛(ài)吃餅干的小白鼠  
正則表達(dá)式是一個(gè)特殊的符號(hào)系列,它可以幫助我們檢查某個(gè)字符串和某種模式匹配。在python中,re庫(kù)擁有全部的正則表達(dá)式的功能。想了解更多的小伙伴可以參考閱讀本文

??正則表達(dá)式  

大家好,大家都聽(tīng)過(guò)正則表達(dá)式,卻不知道正則表達(dá)式干什么的。正則表達(dá)式是一個(gè)特殊的符號(hào)系列,它可以幫助我們檢查某個(gè)字符串和某種模式匹配。在python中,re庫(kù)擁有全部的正則表達(dá)式的功能。

今天,我們來(lái)深入的了解一下。我們知道正則表達(dá)式是處理字符串的強(qiáng)大工具,它有自己的語(yǔ)法結(jié)構(gòu),什么匹配啊,都不算什么。

正則表達(dá)式是什么?

正則表達(dá)式,又稱(chēng)規(guī)則表達(dá)式,(英語(yǔ):Regular Expression,在代碼中常簡(jiǎn)寫(xiě)為 regex、regexp 或 RE),它是計(jì)算機(jī)科學(xué)的一個(gè)概念。正則表達(dá)式通常被用來(lái)檢索、替換那些符合某個(gè)模式的文本。 許多程序設(shè)計(jì)語(yǔ)言都支持利用正則表達(dá)式進(jìn)行字符串操作。例如在 Perl 中內(nèi)建了一個(gè)功能強(qiáng)大的正則表達(dá)式引擎。正則表達(dá)式這個(gè)概念最初是由 Unix 中的工具軟件普及開(kāi)的。正則表達(dá)式是對(duì)字符串(包括普通字符(例如,a 到 z 之間的字母)和特殊字符(稱(chēng)為"元字符"))操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個(gè)"規(guī)則字符串",這個(gè)"規(guī)則字符串"用來(lái)表達(dá)對(duì)字符串的一種過(guò)濾邏輯。正則表達(dá)式是一種文本模式,模式描述在搜索文本時(shí)要匹配的一個(gè)或多個(gè)字符串。

??1.實(shí)例引入

說(shuō)了一大堆廢話,大家可能還是云里霧里的,我們通過(guò)實(shí)例來(lái)說(shuō)明一下,我們可以用正則表達(dá)式測(cè)試工具,或者python都可以,首先,我們輸入一段文本。

hello,my name is Tina,my phone number is 123456 and my web is http://tina.com.

                               [a-zA-z]+://[^\s]*

我們就可以獲取網(wǎng)頁(yè)鏈接,也就是文本中的url,是不是很神奇?

這是因?yàn)樗凶约旱钠ヅ湟?guī)則,部分如下。

模式描述
.任意字符
*0個(gè)或者多個(gè)表達(dá)式
+一個(gè)或者多個(gè)表達(dá)式

  關(guān)于更多的匹配規(guī)則可自行查閱。

?,*,+,\d,\w 都是等價(jià)字符

?等價(jià)于匹配長(zhǎng)度{0,1}

*等價(jià)于匹配長(zhǎng)度{0,}

+等價(jià)于匹配長(zhǎng)度{1,}

\d 等價(jià)于[0-9]

\D 等價(jià)于[^0-9]

\w 等價(jià)于[A-Za-z_0-9]

\W 等價(jià)于[^A-Za-z_0-9]

??2.match()

        這里介紹一個(gè)常用的匹配方法——match(),向他傳入要匹配的字符串以及正則表達(dá)式,就可以檢測(cè)這個(gè)正則表達(dá)式是否匹配字符串。

?匹配目標(biāo)

res = re.match('hello\s(\d+)sword')

?貪婪匹配

res = re.match('hello.*(\d+)sword')

??3.findall()

我們最常用的就是這個(gè),我們看看這個(gè)是如何使用的。

import re
 
useData = str(input('請(qǐng)輸入字符串?dāng)?shù)據(jù):'))
 
'''
匹配字符串中的數(shù)字,+是匹配前面的子表達(dá)式一次或多次
'''
digital = re.findall('\d+',useData)
 
print(digital)

我們看看運(yùn)行結(jié)果

 findall()函數(shù)是返回所有匹配到的字符串,返回值的數(shù)據(jù)類(lèi)型為列表。

??常用符號(hào)

我們?cè)賮?lái)說(shuō)說(shuō)正則表達(dá)式的常用符號(hào)吧。

“.”字符為匹配任意單個(gè)字符。

“\”字符為轉(zhuǎn)義字符。

“[…]”為字符集。

“(.*?)” 是python爬蟲(chóng)最常用的一個(gè)字符,叫貪心算法,可以匹配任意的字符。

 下面我們看一個(gè)示例代碼。

import re
 
a=‘xxixxjshdxxlovexxsfhxxpythonxx'
 
data=re.findall(‘xx(.*?)xx')
 
print(data)

我們運(yùn)行一下,看下效果。

運(yùn)行結(jié)果
[‘I’ ,‘love’,‘python’]

??特殊字符

 所謂特殊字符,就是一些有特殊含義的字符,比如講 runoo*b 中的 ,簡(jiǎn)單的說(shuō)就是表示任何字符串的意思。如果要查找字符串中的 * 符號(hào),則需要對(duì) * 進(jìn)行轉(zhuǎn)義,即在其前加一個(gè) \,runo*ob 匹配字符串 runo\*ob。

 許多元字符要求在試圖匹配它們時(shí)特別對(duì)待。若要匹配這些特殊字符,必須首先使字符"轉(zhuǎn)義",即,將反斜杠字符\ 放在它們前面。下表列出了正則表達(dá)式中的特殊字符:

特別字符描述
$

匹配輸入字符串的結(jié)尾位置。如果設(shè)置了 RegExp 對(duì)象的 Multiline 屬性,則 $ 也匹配 ‘\n’ 或 ‘\r’。要匹配 $ 字符本身,請(qǐng)使用 $。

()標(biāo)記一個(gè)子表達(dá)式的開(kāi)始和結(jié)束位置。子表達(dá)式可以獲取供以后使用。要匹配這些字符,請(qǐng)使用 ( 和 )。
*匹配前面的子表達(dá)式零次或多次。要匹配 * 字符,請(qǐng)使用 *。
+匹配前面的子表達(dá)式一次或多次。要匹配 + 字符,請(qǐng)使用 +。
.匹配除換行符 \n 之外的任何單字符。要匹配 . ,請(qǐng)使用 . 。

 概念說(shuō)了一大堆,大家可能也記不住,我直接說(shuō)幾個(gè)案例,大家就能明白其他的道理。

這是某網(wǎng)的HTML,部分片段如下:

<span class=“price”>§<i>123</i></span>
 
<span class=“price”>§<i>133</i></span>
 
<span class=“price”>§<i>156</i></span>
 
<span class=“price”>§<i>189</i></span>

   大家會(huì)發(fā)現(xiàn)只有中間的一段不一樣,而不一樣的數(shù)據(jù)就是我們想要的,我們?cè)趺从谜齽t表達(dá)式提取出來(lái)呢.

<span class=“price”>§<i>(.*?)</i></span> 

就可以了,我們看看效果吧。

123
133
156
189

??總結(jié)

        我們可以從HTML代碼提取我們想要的數(shù)據(jù)。我們知道正則表達(dá)式就是其中一個(gè)有效的辦法。通過(guò)本文我們基本了解了其中的原理。后面我們將通過(guò)兩個(gè)具體案例來(lái)加深對(duì)正則表達(dá)式的理解。

到此這篇關(guān)于Python正則表達(dá)式基本原理的文章就介紹到這了,更多相關(guān)Python正則表達(dá)式內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python?pandas中read_csv參數(shù)示例詳解

    Python?pandas中read_csv參數(shù)示例詳解

    使用pandas做數(shù)據(jù)處理的第一步就是讀取數(shù)據(jù),數(shù)據(jù)源可以來(lái)自于各種地方,csv文件便是其中之一,下面這篇文章主要給大家介紹了關(guān)于Python?pandas中read_csv參數(shù)詳解的相關(guān)資料,需要的朋友可以參考下
    2023-01-01
  • 關(guān)于python如何生成exe文件

    關(guān)于python如何生成exe文件

    這篇文章主要介紹了關(guān)于python如何生成exe文件,exe全稱(chēng)“executable”,中文意思為“可執(zhí)行的”,是一種文件格式,是指一種可在操作系統(tǒng)存儲(chǔ)空間中浮動(dòng)定位的可執(zhí)行程序,需要的朋友可以參考下
    2023-04-04
  • 分析用Python腳本關(guān)閉文件操作的機(jī)制

    分析用Python腳本關(guān)閉文件操作的機(jī)制

    這篇文章主要介紹了分析用Python腳本關(guān)閉文件操作的機(jī)制,作者分Python2.x版本和3.x版本兩種情況進(jìn)行了闡述,需要的朋友可以參考下
    2015-06-06
  • Python的Flask路由實(shí)現(xiàn)實(shí)例代碼

    Python的Flask路由實(shí)現(xiàn)實(shí)例代碼

    這篇文章主要介紹了Python的Flask路由實(shí)現(xiàn)實(shí)例代碼,在啟動(dòng)程序時(shí),python解釋器會(huì)從上到下對(duì)代碼進(jìn)行解釋?zhuān)?dāng)遇到裝飾器時(shí),會(huì)執(zhí)行,并把函數(shù)對(duì)應(yīng)的路由以字典的形式進(jìn)行存儲(chǔ),當(dāng)請(qǐng)求到來(lái)時(shí),即可根據(jù)路由查找對(duì)應(yīng)要執(zhí)行的函數(shù)方法,需要的朋友可以參考下
    2023-08-08
  • python深度學(xué)習(xí)之多標(biāo)簽分類(lèi)器及pytorch實(shí)現(xiàn)源碼

    python深度學(xué)習(xí)之多標(biāo)簽分類(lèi)器及pytorch實(shí)現(xiàn)源碼

    這篇文章主要為大家介紹了python深度學(xué)習(xí)之多標(biāo)簽分類(lèi)器的使用說(shuō)明及pytorch的實(shí)現(xiàn)源碼,有需要的朋友可以借鑒參考下,希望能夠有所幫助
    2022-01-01
  • python+django快速實(shí)現(xiàn)文件上傳

    python+django快速實(shí)現(xiàn)文件上傳

    本篇文章主要介紹了django快速實(shí)現(xiàn)文件上傳,通過(guò)django web框架來(lái)實(shí)現(xiàn)一些簡(jiǎn)單的功能,有需要的可以了解一下。
    2016-10-10
  • python要安裝在哪個(gè)盤(pán)

    python要安裝在哪個(gè)盤(pán)

    在本篇文章里小編給大家分享的是一篇關(guān)于python必須裝在c盤(pán)嗎的知識(shí)點(diǎn)文章,有興趣的朋友們可以學(xué)習(xí)下。
    2020-06-06
  • python實(shí)現(xiàn)簡(jiǎn)單俄羅斯方塊

    python實(shí)現(xiàn)簡(jiǎn)單俄羅斯方塊

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)簡(jiǎn)單俄羅斯方塊,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-03-03
  • python使用os.listdir和os.walk獲得文件的路徑的方法

    python使用os.listdir和os.walk獲得文件的路徑的方法

    本篇文章主要介紹了python使用os.listdir和os.walk獲得文件的路徑的方法,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧
    2017-12-12
  • Python中threading模塊join函數(shù)用法實(shí)例分析

    Python中threading模塊join函數(shù)用法實(shí)例分析

    這篇文章主要介紹了Python中threading模塊join函數(shù)用法,以實(shí)例形式較為詳細(xì)的分析了join函數(shù)的功能與使用方法,需要的朋友可以參考下
    2015-06-06

最新評(píng)論