Python 正則 re.compile 真的必需嗎
背景:我在爬蟲處理某個文本時,用到了re.findall(),而不是re.compile。遠在新加坡的同事提出了質(zhì)疑,認為以我的水平,不應該寫出這樣影響性能的代碼,讓我優(yōu)化一下。我提出了反駁:既然使用了Python,就不應該太過考慮性能的問題,如果要考慮性能就使用C語言,而不是Python.他接著說:正是因為python性能不夠,所以更應該考慮代碼的優(yōu)化,能做好就應該做到最好.最后,我沒有回話,當然我也沒有進行所謂的優(yōu)化,以下我會給出我自己的觀點.
re.compile()、re.findall()、re.search() 的作用與區(qū)別
1、re.compile()
Python里的re是支持正則表達式的模塊,所謂的正則表達式就是匹配文本里符合條件的語句. re.compile()是根據(jù)包含正則表達式的字符串創(chuàng)建模式對象,以提高匹配效率.例如:
def test(): regex = r'(\d+) years old' content = 'Alex is a 7 years old boy.' reg = re.compile(regex) result = re.search(reg, content).group() print(result) result = 7
2、re.search()
re.search()是在字符串開啟查找模式,如其名:search.例如:
def test(): content = 'Alex is a 7 years old boy.' result = re.search(r'(\d+) years old', content).group() print(result) result = 7
3、re.findall()
re.findall()是返回一個列表,列表里包含了所有符合條件的結(jié)果,例如:
def test(): content = 'Alex is a 7 years old boy.Bob is a 12 years old boy...' result = re.findall(r'(\d+) years old', content) print(result) result = ['7', '12']
我們分歧在他認為我應該先用 re.complile 編譯好正則之后,再匹配,正如我在re.compile舉得例子. 你會說他說的沒錯啊,作者不應該順從同事這個合理的要求,不改就算了還要在這里發(fā)文BB.我想說的是 拋開劑量談毒性,都是耍流氓。對于數(shù)據(jù)來說拋開量級談性能差異,都是耍流氓. 如果要處理的 文本是百萬、千萬、億這個級別,我會做優(yōu)化,但是對于個別剛上萬的數(shù)據(jù)來說,我覺得沒必要,業(yè)務(wù)流程真的不缺那0.0X秒,多寫一行re.compile的時間遠大于提示的時間了. 做好代碼的優(yōu)化很重要,特別是面對大量數(shù)據(jù)的時候,但是我們要想清楚,有時候并不是靠那幾行re.compile就能提高多大的性能,精簡流程,合理的設(shè)計模式才是重點. 工作中還是要做好和同事的溝通,不要和我一樣,不然遲早會被別人唾棄.
根據(jù)下面評論的提示re.compile()那一行應該放在迭代外面的代碼塊里,相比圖中的時間速度會有所提升.????.但是我們的業(yè)務(wù)邏輯是和上圖一樣的,而不是在迭代之外.
到此這篇關(guān)于Python 正則 re.compile 真的必需嗎的文章就介紹到這了,更多相關(guān)Python 正則 re.compile內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- 10分鐘教你用Python實現(xiàn)微信自動回復功能
- python實現(xiàn)微信自動回復功能
- python itchat實現(xiàn)微信自動回復的示例代碼
- 利用python微信庫itchat實現(xiàn)微信自動回復功能
- python實現(xiàn)微信小程序自動回復
- python微信公眾號之關(guān)鍵詞自動回復
- python實現(xiàn)微信機器人: 登錄微信、消息接收、自動回復功能
- Python中re.compile函數(shù)的使用方法
- 關(guān)于Python中compile() 函數(shù)簡單實用示例詳解
- Python正則表達式re.compile()和re.findall()詳解
- Python中請不要再用re.compile了
- python內(nèi)置函數(shù)compile(),complex()的使用
相關(guān)文章
深入了解Python中字符串格式化工具f-strings的使用
從Python?3.6版本開始,引入了一種新的字符串格式化機制,即f-strings,它強大且易于使用的字符串格式化方式,本文就來聊聊他的具體使用,希望對大家有所幫助2023-05-05python監(jiān)控nginx端口和進程狀態(tài)
這篇文章主要為大家詳細介紹了python監(jiān)控nginx端口和進程狀態(tài),具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-09-09python 篩選數(shù)據(jù)集中列中value長度大于20的數(shù)據(jù)集方法
今天小編就為大家分享一篇python 篩選數(shù)據(jù)集中列中value長度大于20的數(shù)據(jù)集方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-06-06Matplotlib直方圖繪制中的參數(shù)bins和rwidth的實現(xiàn)
本文主要介紹了Matplotlib直方圖繪制中的參數(shù)bins和rwidth的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2022-02-02python使用threading.Condition交替打印兩個字符
這篇文章主要為大家詳細介紹了python使用threading.Condition交替打印兩個字符,具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-05-05