亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python使用正則表達(dá)式匹配反斜杠\遇到的問題

 更新時(shí)間:2022年09月02日 14:26:32   作者:weixin_42576837  
在學(xué)習(xí)Python正則式的過程中,有一個(gè)問題一直困擾我,如何去匹配一個(gè)反斜杠(即“\”),下面這篇文章主要給大家介紹了關(guān)于python使用正則表達(dá)式匹配反斜杠\的相關(guān)資料,需要的朋友可以參考下

遇到的問題:

在做爬蟲的時(shí)候,爬取的url鏈接內(nèi)還有轉(zhuǎn)義字符,反斜杠 \,打算用正則的re.sub()替換掉的時(shí)候遇到了問題,這是要做替換的字符串

最開始直接寫

re.sub("\\","",item)

編譯器漏紅了

然后就是找解決辦法,最后發(fā)現(xiàn)要用四個(gè)反斜杠才可以,也就是使用

re.sub("\\\\","",item)

查了查資料,簡單說說我自己的理解。

正則表達(dá)式

首先就是正則表達(dá)式,對于正則表達(dá)式來說,他的語法是獨(dú)立的,有自己的語法,在正則表達(dá)式中,由于反斜杠 \ 是一個(gè)特殊字符,可以和其他字母形成轉(zhuǎn)義字符,所以要想表示一個(gè)反斜杠 \ 就必須寫成 \\ 這種形式。所以對于正則表達(dá)式來說,如果要匹配一個(gè)\ 就要寫成\\,像這樣:

匹配反斜杠\

python字符串

在python中,如果想要輸出一個(gè)反斜杠\字符,同樣要使用轉(zhuǎn)義:

>>> print("\\")
\

同樣是因?yàn)樵趐ython中反斜杠也是一個(gè)特殊字符。

綜上

當(dāng)寫成

    item = "https:\/\/jobs.51job.com/guangzhou-thq\/137115906.html?s=sou_sou_soulb&t=0_0"
    item = re.sub("\\\\","",item)

首先傳入的一個(gè)參數(shù)是一個(gè)字符串,所以python中的字符串解析器會(huì)把"\\\\"解析成
\\,解析之后會(huì)再傳遞給正則表達(dá)式的解析器。由于正則表達(dá)式也有自己的語法結(jié)構(gòu),所以當(dāng)它看到\\時(shí),會(huì)把它解析為一個(gè)\,所以這時(shí)候正則匹配就會(huì)只匹配一個(gè)\

貼一個(gè)Stackoverflow上的回答:

If you’re putting this in a string within a program, you may actually
need to use four backslashes (because the string parser will remove
two of them when “de-escaping” it for the string, and then the regex
needs two for an escaped regex backslash).
For instance:

regex("\\\\") is interpreted as…

regex("\\" [escaped backslash] followed by "\\" [escaped backslash])
is interpreted as…

regex(\\) is interpreted as a regex that matches a single backslash.

原文地址:Can’t escape the backslash with regex?

當(dāng)然還可以使用 raw string來寫,也就是寫成

re.sub(r'\\','',item)

由于使用了r'\\',python的字符串解析器看到r'\\'之后,就直接將外層的r''去掉然后傳遞給re解析器,re解析器會(huì)再次解析\\\,匹配內(nèi)容是一個(gè)反斜杠\

字符串方法replace()

除了使用正則替換之外,還可以使用字符串的replace()

str.replace(old, new[, max])
old – 將被替換的子字符串。
new – 新字符串,用于替換old子字符串。
max – 可選字符串, 替換不超過 max 次

>>> item
'https:\\/\\/jobs.51job.com/guangzhou-thq\\/137115906.html?s=sou_sou_soulb&t=0_0'
>>> item.replace('\\','')
'https://jobs.51job.com/guangzhou-thq/137115906.html?s=sou_sou_soulb&t=0_0'
>>>

需要注意的是不論是正則的re.sub()還是str.replace(),使用之后都不會(huì)對原始字符串改變:

import re

urL ='https:\/\/jobs.51job.com\/guangzhou-thq\/137735415.html?s=sou_sou_soulb&t=0_0'
print(urL.replace('\\',''))
print(urL)

print(re.sub(r'\\','',urL))
print(urL)

結(jié)果

總結(jié) 

到此這篇關(guān)于python使用正則表達(dá)式匹配反斜杠\遇到問題的文章就介紹到這了,更多相關(guān)python正則表達(dá)式匹配反斜杠\內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 一文帶你掌握Python中pathlib模塊的用法

    一文帶你掌握Python中pathlib模塊的用法

    pathlib?模塊提供了表示文件系統(tǒng)路徑的類,可適用于不同的操作系統(tǒng),本文將帶你學(xué)習(xí)如何使用?pathlib?模塊中的?Path?類讀寫文件、操縱文件路徑等操作,需要的可以參考下
    2023-08-08
  • Python操作Excel工作簿的示例代碼(\*.xlsx)

    Python操作Excel工作簿的示例代碼(\*.xlsx)

    這篇文章主要介紹了Python操作Excel工作簿的示例代碼(\*.xlsx),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-03-03
  • 詳解Python中pandas的安裝操作說明(傻瓜版)

    詳解Python中pandas的安裝操作說明(傻瓜版)

    這篇文章主要介紹了Python中pandas的安裝操作說明,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-04-04
  • python 判斷自定義對象類型

    python 判斷自定義對象類型

    python 判斷自定義對象類型 判斷內(nèi)建的類型可以用type。
    2009-03-03
  • Django程序的優(yōu)化技巧

    Django程序的優(yōu)化技巧

    如果你的Python程序或Django項(xiàng)目運(yùn)行速度慢,先別急著怪Python或Django。其實(shí)程序運(yùn)行效率是可以通過提升硬件水平、架構(gòu)和數(shù)據(jù)庫優(yōu)化和改進(jìn)算法來大大提升的。今天大江哥將分享一些主要Django性能優(yōu)化手段,完全可以讓你的Django程序跑得飛快。
    2021-04-04
  • 解決Python出現(xiàn)_warn_unsafe_extraction問題的方法

    解決Python出現(xiàn)_warn_unsafe_extraction問題的方法

    這篇文章主要為大家詳細(xì)介紹了解決Python出現(xiàn)'_warn_unsafe_extraction'問題的方法,感興趣的小伙伴們可以參考一下
    2016-03-03
  • Python常用爬蟲代碼總結(jié)方便查詢

    Python常用爬蟲代碼總結(jié)方便查詢

    今天小編就為大家分享一篇關(guān)于Python常用爬蟲代碼總結(jié)方便查詢,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧
    2019-02-02
  • 詳解Python如何循環(huán)遍歷Numpy中的Array

    詳解Python如何循環(huán)遍歷Numpy中的Array

    Numpy是Python中常見的數(shù)據(jù)處理庫,是數(shù)據(jù)科學(xué)中經(jīng)常使用的庫。在本文中,我們將學(xué)習(xí)如何迭代遍歷訪問矩陣中的元素,需要的可以參考一下
    2022-04-04
  • Python基于PyGraphics包實(shí)現(xiàn)圖片截取功能的方法

    Python基于PyGraphics包實(shí)現(xiàn)圖片截取功能的方法

    這篇文章主要介紹了Python基于PyGraphics包實(shí)現(xiàn)圖片截取功能的方法,涉及PyGraphics包的安裝及基于PyGraphics包實(shí)現(xiàn)圖片的打開、讀取、截取等相關(guān)操作技巧,需要的朋友可以參考下
    2017-12-12
  • Pycharm中import torch報(bào)錯(cuò)的快速解決方法

    Pycharm中import torch報(bào)錯(cuò)的快速解決方法

    這篇文章主要介紹了Pycharm中import torch報(bào)錯(cuò)的快速解決方法,很多朋友容易碰到這個(gè)問題,今天小編特此把解決方案分享到腳本之家平臺(tái)供大家參考,需要的朋友可以參考下
    2020-03-03

最新評論