js正則學習小記之匹配字符串字面量
今天看了第5章幾個例子,有點收獲,記錄下來當作回顧也當作分享。
關于匹配字符串問題,有很多種類型,今天討論 js 代碼里的字符串匹配。(因為我想學完之后寫個語法高亮練手,所以用js代碼當作例子)
var str1 = "我是字符串1哦,快把我取走", str2 = "我是字符串2哦,快把我取走";
比如這樣一個字符串,匹配起來很簡單 /"[^"]*"/g 即可。
PS: 白色截圖是 chrome 34 控制臺中運行的結果,深灰色是 sublime text 結果。
很容易就取到內(nèi)容了,可是親,你有沒有想過,js字符串里允許轉義。
var str1 = "我是字符串1哦,\"快把我取走\"", str2 = "我是字符串2哦,\"快把我取走\"";
這不是我們想要的結果,所以我們要處理下轉義問題。
轉義的規(guī)則是 \ 后面跟著一個字符,所以我們用 \\. 去匹配它,就有了這樣的正則 /"(?:\\.|[^"])*"/g
可能對于正則不熟悉的朋友,一下子從 /"[^"]*"/g 變到 /"(?:\\.|[^"])*"/g 后理解不了,我簡單說明下。
(?:) 是非捕獲組,就是不會把內(nèi)容抓取保存到內(nèi)存里的。
\\. 用于匹配 \" \' \a 之類的轉義字符,匹配成功的話消耗2個字符。
[^"] 匹配除了 " 以外的所有字符,匹配成功的話消耗1個字符。
所以這個表達式的意思是,先匹配 \. 這樣轉義,如果成功會消耗掉正確的轉義,如果不成功就用 [^"] 匹配。
消耗掉正確的轉義的意思是,比如 "aa\\aa\"aa\ufffaa" 都會被正常匹配,因為這些都在正常的轉義。
形如 "aa\\aa\"aa\ufff\\"aa" 這里的 \\" 其中 \\ 會被匹配,而 " 既不滿足 \\. 也不滿足 [^"]
所以這個匹配結果會是 "aa\\aa\"aa\ufff\\" 后面的 aa" 無法匹配到。
所以現(xiàn)在我們得到了比較強力的正則,可以有效的匹配 js 代碼中的字符串了。
騷等,好像還有哪里不對。
js 字符串允許折行,形如這樣。
var str = "大家好\ 我是js";
但是這樣的字符串用剛才的正則能匹配么?答案是能。
因為 \ 不能被 \\. 匹配,但是可以被 [^"] 匹配到,\ 后面一個字符是 \r, \n 或 \r\n (具體是什么換行符要看系統(tǒng)了) 都能被 [^"] 匹配到,所以我們無意間寫了個強力的表達式。
現(xiàn)在剩下最后一個問題了,就是 ' 的匹配。
我們修改下表達式 /"(?:\\.|[^"])*"|'(?:\\.|[^'])*'/g 就好了。
來測試一下:
var str1 = "我是字符串1哦,\ \"快把我取走\"", str2 = '我是字符串2哦,\ \'快把我取走\'';
匹配成功。
好了,這些就是今天的分享了,明天見。
相關文章
讓editplus3 函數(shù)模板完全顯示函數(shù)
我是常常使用editplus ,主要是它啟動快,文件小,自定義代碼,綠色。發(fā)現(xiàn)當用他打開php有一個快捷鍵ctrl+F11可以打開函數(shù)列表,也就是文件內(nèi)所有的函數(shù)名會顯示在列表中,雙擊會選中函數(shù),非常方便2012-10-10使用正則表達式實現(xiàn)網(wǎng)頁爬蟲的思路詳解
網(wǎng)頁爬蟲:就是一個程序用于在互聯(lián)網(wǎng)中獲取指定規(guī)則的數(shù)據(jù)。這篇文章主要介紹了使用正則表達式實現(xiàn)網(wǎng)頁爬蟲的思路詳解,需要的朋友可以參考下2018-12-12正則表達式語法規(guī)則及在Javascript和C#中的使用方法
正則表達式通常被用來檢索和/或替換那些符合某個模式的文本內(nèi)容。許多程序設計語言都支持利用正則表達式進行字符串操作2013-10-10