正則表達(dá)式學(xué)習(xí)問答
舉個(gè)簡單的例子吧,Unix下的usr、dev等名字,就是那時(shí)留傳下來的,現(xiàn)在已經(jīng)有很多人詬病了,usr不是user,dev不是device,難學(xué),也難記。經(jīng)過這些年的飛速發(fā)展,當(dāng)年的很多問題已經(jīng)被包裝得美輪美奐,如今的用戶可能更習(xí)慣直接點(diǎn)擊“用戶目錄”、“驅(qū)動器”之類的圖標(biāo),再也不用為那些不規(guī)則的簡短名字發(fā)愁。但是不幸的是,一直以來正則表達(dá)式的語法卻沒有太多的變化,甚至后續(xù)增加的功能,也沿襲了之前的語法風(fēng)格,在編程語言日漸人性化的今天,它自然顯得非常難懂了。今天的開發(fā)人員可能更習(xí)慣Regex.CharRange(‘a(chǎn)', ‘z')這樣的寫法,而不習(xí)慣[a-z];遇到(?![a-z])這樣的結(jié)構(gòu)就更是抓瞎,除非轉(zhuǎn)為Regex.CheckRight(Regex.CharRange(‘a(chǎn)', ‘z'))的寫法。
不過,換一個(gè)角度來看,兩者其實(shí)是一回事,只是表現(xiàn)形式不同,一個(gè)類似要訣,一個(gè)類似大白話。如果我們能在頭腦里構(gòu)建出從要訣到大白話的轉(zhuǎn)換,正則表達(dá)式就簡單了許多,甚至可以說就是模塊的拼接。比如支付寶的流水號為18或26位數(shù)字,用正則表達(dá)式匹配,就是^([0-9]{18}|[0-9]{26})$,或者^[0-9]{18}([0-9]{8})?$。其中的邏輯很簡單:^用來鎖定開頭,$用來鎖定結(jié)尾,[0-9]匹配數(shù)字字符,([0-9]{18}|[0-9]{26})表示兩個(gè)并列的選項(xiàng),即數(shù)字字符串長度為18位或26位,而[0-9]{18}([0-9]{8})?表示至少需要出現(xiàn)18位的數(shù)字字符串,在這之后可能還有一個(gè)8位的數(shù)字字符串(所以總長度是26位)。一般的正則表達(dá)式應(yīng)用,就是這么簡單。
如果你覺得上面說的沒錯(cuò),那么學(xué)習(xí)正則表達(dá)式的難題就只剩下了選擇得當(dāng)?shù)姆椒?。我們學(xué)習(xí)編程語言時(shí),都強(qiáng)調(diào)不能只看書,要動手寫程序,甚至最好的辦法是把書上的例子親自輸入運(yùn)行一遍,這樣才算真正學(xué)會了。但在許多人眼里,正則表達(dá)式或許算不上編程語言,所以學(xué)習(xí)是點(diǎn)到即止,甚至是滿足于從網(wǎng)絡(luò)上抄一些現(xiàn)成的表達(dá)式。所以,常見的問題之一是“有沒有什么學(xué)習(xí)的捷徑”,很不幸,答案是沒有——既然拷貝他人的代碼不能學(xué)會編程,抄閱現(xiàn)成的表達(dá)式、隨便翻幾篇文檔,當(dāng)然也學(xué)不會正則。不過也有幸運(yùn)的消息,真正學(xué)會正則表達(dá)式并不需要花太長的時(shí)間。
以我的經(jīng)驗(yàn),學(xué)習(xí)正則表達(dá)式,真正要做的是深入理解常用功能:字符組、多選分支、匹配模式、環(huán)視??梢哉f,弄明白了這幾點(diǎn),80%的正則問題都可以解決。但是要弄明白這幾點(diǎn),就需要專門的學(xué)習(xí):字符組是解決什么問題的,它是怎么使用的?多選分支是解決什么問題的,它是怎么使用的?應(yīng)當(dāng)抽一些時(shí)間專門學(xué)習(xí)、思考;這些都弄明白了,再研究解決復(fù)雜問題的表達(dá)式是怎么構(gòu)成的。如果你可以每天抽1-2小時(shí)專門學(xué)習(xí),兩周內(nèi)就會有明顯收效,一個(gè)月幾乎就可以修煉到相當(dāng)水平。而且,以我的經(jīng)驗(yàn),在學(xué)習(xí)新的編程語言時(shí),不但要把書上的例子都親自輸入運(yùn)行一遍,更要自己動手去改一改示例代碼,看看會出現(xiàn)什么現(xiàn)象,再想想為什么會這樣。如果你在學(xué)習(xí)正則表達(dá)式時(shí)也做到這一點(diǎn),必然能夠事半功倍。
如果你真正理解了這些常用功能,對它們的價(jià)值和使用有清晰的概念,那么另一個(gè)麻煩也就迎刃而解了——不同語言的正則表達(dá)式不同,如何解決?雖然不同語言中的正則表達(dá)式規(guī)定各有不同,但背后的思想是統(tǒng)一的,不同的只是表現(xiàn)形式,或者說概念的落地方式。好處在于,編程語言的文檔不會詳細(xì)講解什么是字符組,什么是多選分支,但會詳細(xì)告訴你字符組在本語言中是如何表示的,多選分支又是如何表示的(不信你可以在這些文檔中搜索character class或者alternation)。所以如果你的腦子足夠清楚,即便不確定最終的表達(dá)式如何寫,也只需要查文檔就可以解決。舉個(gè)例子,匹配空白字符的字符組\s,在Java字符串中要寫作\\s,因?yàn)閈s并不是Java字符串中的一個(gè)合法轉(zhuǎn)義序列,所以之前還必須有\(zhòng)來轉(zhuǎn)義\;在PHP中可以直接寫作\s,因?yàn)镻HP處理字符串時(shí)會把無法識別的轉(zhuǎn)義序列原封不動地保存下去;在Unix下的某些工具中,必須寫作[[:space:]],這是Perl風(fēng)格的\s在POSIX規(guī)范中的表示法??雌饋肀容^麻煩,也僅此而已,因?yàn)槲覀冎溃@里需要用到的,就是“匹配空白字符的字符組”。
以上寫了這么多,可能有人會說:正則表達(dá)式這東西,不登大雅之堂,沒必要花那么多精力。或許正是這種觀點(diǎn),形成了“不認(rèn)真學(xué)習(xí)正則表達(dá)式”思想根源。幸運(yùn)的是,這個(gè)問題其實(shí)很好想明白,因?yàn)楹芏嗍虑槎际沁@個(gè)道理。比如寫文章,我們不要求人人都是作家,但是人人都有可能在需要的時(shí)候?qū)懗鰩灼玫贸鍪值恼?jīng)文章,“不是作家”并不是“需要時(shí)寫不出正經(jīng)文章”的理由。為了能在需要的時(shí)候?qū)懗稣?jīng)文章,就必須專門抽出時(shí)間來學(xué)習(xí)和聯(lián)系寫作。正則表達(dá)式的學(xué)習(xí),其實(shí)也是這個(gè)道理。
- php 正則表達(dá)式學(xué)習(xí)筆記
- 正則表達(dá)式口訣_學(xué)習(xí)正則的朋友值得一看
- 正則表達(dá)式口訣 正則表達(dá)式學(xué)習(xí)工具
- 正則表達(dá)式 學(xué)習(xí)資料整理
- 正則表達(dá)式 學(xué)習(xí)參考 推薦入門者看
- JS 正則表達(dá)式(學(xué)習(xí)筆記2)匹配網(wǎng)址url參數(shù)
- Python模塊學(xué)習(xí) re 正則表達(dá)式
- javascript的正則表達(dá)式學(xué)習(xí)資料復(fù)習(xí)
- 重溫JavaScript中的正則表達(dá)式 js學(xué)習(xí)筆記
- Java 正則表達(dá)式學(xué)習(xí)總結(jié)和一些小例子
- MySql官方手冊學(xué)習(xí)筆記2 MySql的模糊查詢和正則表達(dá)式
- js 正則表達(dá)式學(xué)習(xí)筆記之匹配字符串
- Powershell學(xué)習(xí)筆記--使用正則表達(dá)式查找文件
- 正則表達(dá)式詳細(xì)介紹(上)
相關(guān)文章
正則表達(dá)式實(shí)現(xiàn)與或非關(guān)系【推薦】
這篇文章主要介紹了正則表達(dá)式實(shí)現(xiàn)與或非關(guān)系,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2018-07-07JavaScript正則表達(dá)式校驗(yàn)非正整數(shù)實(shí)例
本文分享了js正則表達(dá)式(^((-\d+)|(0+))$)校驗(yàn)非正整數(shù)實(shí)例代碼,代碼簡單易懂,需要的朋友可以看下2016-12-12asp.net中利用正則表達(dá)式判斷一個(gè)字符串是否為數(shù)字的代碼
asp.net中利用正則表達(dá)式判斷一個(gè)字符串是否為數(shù)字的代碼,需要的朋友可以參考下。2011-12-12正則表達(dá)式驗(yàn)證身份證號碼和郵箱、判斷checked選中狀態(tài)
這篇文章主要介紹了正則表達(dá)式驗(yàn)證身份證號碼和郵箱、判斷checked選中狀態(tài)的相關(guān)知識,需要的朋友可以參考下2017-07-07在ASP中用“正則表達(dá)式對象”來校驗(yàn)數(shù)據(jù)的合法性
在ASP中用“正則表達(dá)式對象”來校驗(yàn)數(shù)據(jù)的合法性...2006-06-06正則表達(dá)式提取網(wǎng)址、標(biāo)題、圖片等一例(.Net Asp Javascript/Js)的實(shí)現(xiàn)
用各種語言實(shí)現(xiàn)的提取內(nèi)容中的網(wǎng)址,標(biāo)題,圖片等功能代碼,對于大家掌握正則的共用性有很大的幫助。2008-11-11