亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

總結(jié)JavaScript的正則與其他語言的不同之處

 更新時間:2016年08月25日 10:19:18   作者:紫云飛  
我接觸過不少語言,我很看重一門語言的正則表達式是否強大,還有正則與語法的結(jié)合是否緊密.在這一點上,JavaScript做的還不錯,至少有正則字面量.當然,最強大的還是Perl.但最近發(fā)現(xiàn)JavaScript中的正則有幾個不同于其他語言的地方,下面一起來看下。

前言

最近發(fā)現(xiàn)JavaScript中的正則在某些地方的表現(xiàn)和其他語言或工具中的正則有些不同,比較另類.雖然你幾乎不可能寫出也幾乎用不到下面我講的這些正則,但是了解一下畢竟是好的.

本文中的代碼示例都是在兼容ES5的JavaScript環(huán)境中執(zhí)行的,也就是說,IE9之前版本,Fx4左右的版本,等,中的表現(xiàn)很有可能和我下面講的不一樣.

1.空字符類

不包含任何字符的字符類[]稱之為空字符類(empty char class),我相信你沒聽別人這么叫過,因為在其他語言中,這種寫法是非法的,所有的文檔和教程都不會講一種非法的語法.下面我演示一下其他語言或工具都是怎么報這個錯的:

$echo | grep '[]'
grep: Unmatched [ or [^

$echo | sed '/[]/'
sed:-e 表達式 #1,字符 4:未終止的地址正則表達式

$echo | awk '/[]/'
awk: cmd. line:1: /[]/
awk: cmd. line:1: ^ unterminated regexp
awk: cmd. line:1: error: Unmatched [ or [^: /[]//

$echo | perl -ne '/[]/'
Unmatched [ in regex; marked by <-- HERE in m/[ <-- HERE ]/ at -e line 1.

$echo | ruby -ne '/[]/'
-e:1: empty char-class: /[]/

$python -c 'import re;re.match("[]","")'
Traceback (most recent call last):
 File "<string>", line 1, in <module>
 File "E:\Python\lib\re.py", line 137, in match
 return _compile(pattern, flags).match(string)
 File "E:\Python\lib\re.py", line 244, in _compile
 raise error, v # invalid expression
sre_constants.error: unexpected end of regular expression

而在JavaScript中,空字符類是合法的正則組成部分,不過它的效果是"永不匹配",也就是匹配什么都會失敗.相當于一個空否定正向環(huán)視(empty negative lookahead)(?!)的效果:

js> "whatever\n".match(/[]/g) //空字符類,永不匹配
null
js> "whatever\n".match(/(?!)/g) //空否定正向環(huán)視,永不匹配
null

很顯然,這種東西在JavaScript中沒什么用.

2.否定空字符類

不包含任何字符的否定字符類[^]稱之為否定空字符類(negative empty char class)或者叫空否定字符類(empty negative char class),都可以,因為這個名詞是我"自創(chuàng)"的,和上面講的空字符類類似,這種寫法在其他語言中也是非法的:

$echo | grep '[^]'
grep: Unmatched [ or [^

$echo | sed '/[^]/'
sed:-e 表達式 #1,字符 5:未終止的地址正則表達式

$echo | awk '/[^]/'
awk: cmd. line:1: /[^]/
awk: cmd. line:1: ^ unterminated regexp
awk: cmd. line:1: error: Unmatched [ or [^: /[^]//

$echo | perl -ne '/[^]/'
Unmatched [ in regex; marked by <-- HERE in m/[ <-- HERE ^]/ at -e line 1.

$echo | ruby -ne '/[^]/'
-e:1: empty char-class: /[^]/

$python -c 'import re;re.match("[^]","")'
Traceback (most recent call last):
 File "<string>", line 1, in <module>
 File "E:\Python\lib\re.py", line 137, in match
 return _compile(pattern, flags).match(string)
 File "E:\Python\lib\re.py", line 244, in _compile
 raise error, v # invalid expression
sre_constants.error: unexpected end of regular expression
$

而在JavaScript中,否定空字符類是合法的正則組成部分,它的效果和空字符類的效果剛剛相反,它可以匹配任意的字符,包括換行符"\n" ,也就是說,等同于常見的[\s\S][\w\W] :

js> "whatever\n".match(/[^]/g)  //否定空字符類,匹配任意字符
["w", "h", "a", "t", "e", "v", "e", "r", "\n"]
js> "whatever\n".match(/[\s\S]/g)  //互補字符類,匹配任意字符
["w", "h", "a", "t", "e", "v", "e", "r", "\n"] 

需要注意的是,它不能稱之為是"永匹配正則",因為字符類必須要有一個字符才可能匹配,如果目標字符串是空的,或者已經(jīng)被左邊的正則消耗完了,則匹配會失敗,比如:

js> /abc[^]/.test("abc") //c后面沒有字符了,匹配失敗.
false

想要了解真正的"永匹配正則",可以看看我以前翻譯的一篇文章:"空"正則

3.[]]和[^]]

這個講起來比較簡單,就是:在Perl和其他一些linux命令的正則表達式中,字符類[]中如果包含了一個緊跟著左方括號的右方括號[]] ,則這個右方括號會被當作一個普通字符,即只能匹配"]",而在JavaScript中,這種正則會被識別成一個空字符類后跟一個右方括號,空字符類什么都不匹配.[^]]也類似:在JavaScript中,它匹配的是一個任意字符(否定空字符類)后跟一個右中括號,比如"a]","b]" ,而在其他語言中,匹配的是任何非]的字符.

$perl -e 'print "]" =~ /[]]/'
1

$js -e 'print(/[]]/.test("]"))'
false

$perl -e 'print "x" =~ /[^]]/'
1

$js -e 'print(/[^]]/.test("x"))'
false 

4.$錨點

有些初學(xué)者認為$匹配的是換行符"\n" ,這是大錯特錯的,$是一個零寬斷言(zero-width  assertion),它是不可能匹配到一個真正的字符的,它只能匹配一個位置.我要的講的區(qū)別發(fā)生在非多行模式中:你也許會認為,在非多行模式中,$匹配的不就是最后一個字符后面的位置嗎?實際上沒那么簡單,在其他大部分語言中,如果目標字符串中的最后一個字符是換行符"\n" ,則$還會匹配那個換行符之前的位置,也就是匹配了末尾的換行符左右兩邊的兩個位置.很多語言中都有\(zhòng)Z和\z這兩個表示法,如果你知道它們之間的區(qū)別,那你應(yīng)該就明白了,在其他語言中(Perl,Python,php,Java,c#...),非多行模式下的$相當于\Z,而在JavaScript中,非多行模式下的$相當于\z(只會匹配最末尾的那個位置,不管最后一個字符是否是換行符).Ruby是個特例,因為它默認就是多行模式,多行模式下$會匹配每個換行符前面的位置,當然也會包括結(jié)尾處可能出現(xiàn)的那個換行符.余晟著的《正則指引》一書中也講到了這幾點.

$perl -e 'print "whatever\n" =~ s/$/替換字符/rg' //全局替換
whatever替換字符   //換行符前面的那個位置被替換
替換字符    //換行符后面的那個位置被替換

$js -e 'print("whatever\n".replace(/$/g,"替換字符"))' //全局替換
whatever
替換字符    //換行符后面的那個位置被替換

5.點號元字符"."

在JavaScript中的正則表達式中,點號元字符"."可以匹配四個行終止符(\r-回車符,\n-換行符,\u2028-行分隔符,\u2029-段落分隔符)之外的所有字符,而在其他常用語言中,只會排除掉換行符\n.

6.向前引用

我們都知道正則中有反向引用(back reference),也就是用一個反斜杠+數(shù)字的形式引用到前面的某個捕獲分組已經(jīng)匹配到的字符串,目的是用來再次匹配或作為替換結(jié)果(\變成$).但有種特殊情況是,如果那個被引用的捕獲分組還沒開始(左括號為界),就使用了反向引用,會怎樣.比如正則/(\2(a)){2}/ , (a)是第二個捕獲分組,但在它的左邊使用了引用它的匹配結(jié)果的\2,我們知道正則是從左向右進行匹配的,這就是本節(jié)的標題向前引用(forwards reference)的來歷,它并不是一個嚴格的概念.那么現(xiàn)在你想想,下面的這句JavaScript代碼將返回什么:

js> /(\2(a)){2}/.exec("aaa")
???

在回答這個問題之前,先看看其他語言中的表現(xiàn).同樣,在其他語言中,這么寫也基本上是無效的:

$echo aaa | grep '(\2(a)){2}'
grep: Invalid back reference

$echo aaa | sed -r '/(\2(a)){2}/'
sed:-e 表達式 #1,字符 12:非法回引用

$echo aaa | awk '/(\2(a)){2}/'

$echo aaa | perl -ne 'print /(\2(a)){2}/'

$echo aaa | ruby -ne 'print $_ = ~/(\2(a)){2}/'

$python -c 'import re;print re.match("(\2(a)){2}","aaa")'
None

在awk中沒有報錯,是因為awk不支持這種反向引用,其中的\2被解釋成了ASCII碼為2的字符.而在Perl Ruby Python中沒報錯,我不知道為什么這樣設(shè)計,應(yīng)該都是學(xué)Perl的,但效果都一樣,就是這種情況下是不可能匹配成功的.

而在JavaScript中,不僅不報錯,還能匹配成功,看看和你剛才想的答案一樣不一樣:

js> /(\2(a)){2}/.exec("aaa")
["aa", "a", "a"]

防止你忘了exec方法返回的結(jié)果是什么,我說一下.第一個元素是完整的匹配字符串,也就是RegExp["$&"] ,后面的是每個捕獲分組匹配的內(nèi)容,也就是RegExp.$1RegExp.$2.為什么能匹配成功呢,匹配過程是怎樣的?我的理解是:

首先進入了第一個捕獲分組(最左邊的左括號),其中第一個有效匹配項是\2,然而這時第二個捕獲分組(a)還沒輪上,因此RegExp.$2的值還是undefined,所以\2匹配了目標字符串中第一個a左邊的一個空字符,或者說"位置",就像^和其他零寬斷言一樣.重點是匹配成功了.繼續(xù)走,這時第二個捕獲分組(a)匹配到了目標字符串中的第一個a,RegExp.$2的值也被賦值為"a",然后是第一個捕獲分組結(jié)束(最右邊的右括號),RegExp.$1的值也是"a".然后是量詞{2},也就是說,要從目標字符串中的第一個a之后,開始進行正則(\2(a))的新的一輪匹配,很關(guān)鍵的一點在這里:就是RegExp.$2的值也就是\2匹配的值還是不是第一輪匹配結(jié)束時的被賦的值"a",答案是:"不是",RegExp.$1RegExp.$2的值都會被清空為undefined,\1和\2又會和第一次一樣,成功匹配一個空字符(相當于無任何效果,寫不寫都一樣).成功匹配了目標字符串中的第二個a,這時RegExp.$1RegExp.$2的值又一次成為了"a",RegExp["$&"]的值成為了完整的匹配字符串,前兩個a:"aa".

在Firefox的早期版本(3.6)中,量詞的重新一輪匹配不會清空已有的捕獲分組的值,那么也就是說,在第二輪匹配的時候,\2會匹配上第二個a,從而:

js> /(\2(a)){2}/.exec("aaa")
["aaa", "aa", "a"]

另外,一個捕獲分組的結(jié)束要看右括號是否閉合,比如/(a\1){3}/,雖然用到\1的時候,第一個捕獲分組已經(jīng)開始匹配了,但還沒結(jié)束,這同樣是向前引用,所以\1匹配的仍然是空:

js> /(a\1){3}/.exec("aaa")
["aaa", "a"]

再解釋一個例子:

js> /(?:(f)(o)(o)|(b)(a)(r))*/.exec("foobar")
["foobar", undefined, undefined, undefined, "b", "a", "r"]

*號是量詞,第一輪匹配過后:$1為"f",$2為"o",$3為"o",$4為undefined,$5為undefined,$6為undefined.

第二輪匹配開始時:捕獲到的值全部重置為undefined.

第二輪匹配過后:$1為undefined,$2為undefined,$3為undefined,$4為"b",$5為"a",$6為"r".

&被賦值為"foobar",匹配結(jié)束.

總結(jié)

以上就是總結(jié)JavaScript的正則與其他語言不同之處的全部內(nèi)容,希望本文的內(nèi)容對大家的學(xué)習(xí)和工作能帶來幫助。

相關(guān)文章

  • JS判斷瀏覽器類型與操作系統(tǒng)的方法分析

    JS判斷瀏覽器類型與操作系統(tǒng)的方法分析

    這篇文章主要介紹了JS判斷瀏覽器類型與操作系統(tǒng)的方法,結(jié)合實例形式分析了JS針對各種常見瀏覽器與操作系統(tǒng)進行判斷的方法,需要的朋友可以參考下
    2020-04-04
  • 刷新頁面實現(xiàn)方式總結(jié)(HTML,ASP,JS)

    刷新頁面實現(xiàn)方式總結(jié)(HTML,ASP,JS)

    多種方法實現(xiàn)頁面的刷新代碼
    2008-11-11
  • js實現(xiàn)手表表盤時鐘與圓周運動

    js實現(xiàn)手表表盤時鐘與圓周運動

    這篇文章主要為大家詳細介紹了js實現(xiàn)手表表盤時鐘與圓周運動,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2020-09-09
  • 利用原生JavaScript實現(xiàn)造日歷輪子實例代碼

    利用原生JavaScript實現(xiàn)造日歷輪子實例代碼

    這篇文章主要給大家介紹了關(guān)于如何利用原生JavaScript實現(xiàn)造日歷輪子的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家學(xué)習(xí)或者使用JavaScript具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-05-05
  • js取兩個數(shù)組的交集|差集|并集|補集|去重示例代碼

    js取兩個數(shù)組的交集|差集|并集|補集|去重示例代碼

    求兩個集合的補集、交集、差集、并集等等在實際應(yīng)用中經(jīng)常會使用到,下面與大家分享下具體的實現(xiàn)代碼,感興趣的朋友可以參考下,希望對大家有所幫助
    2013-08-08
  • JS實現(xiàn)簡單獲取最近7天和最近3天日期的方法

    JS實現(xiàn)簡單獲取最近7天和最近3天日期的方法

    這篇文章主要介紹了JS實現(xiàn)簡單獲取最近7天和最近3天日期的方法,涉及javascript針對日期與時間的相關(guān)數(shù)值運算與轉(zhuǎn)換操作技巧,需要的朋友可以參考下
    2018-04-04
  • JavaScript數(shù)組操作之旋轉(zhuǎn)二維數(shù)組

    JavaScript數(shù)組操作之旋轉(zhuǎn)二維數(shù)組

    這篇文章主要介紹了JavaScript數(shù)組操作之旋轉(zhuǎn)二維數(shù)組,主要從兩個方面展開文章介紹,一是通過對數(shù)組的操作熟練度;二是(鏡像反轉(zhuǎn))比實現(xiàn)一更優(yōu),減少了空間復(fù)雜度,內(nèi)容介紹具有一定的參考價值,需要的小伙伴可以參考一下
    2022-04-04
  • ES6中Set和Map數(shù)據(jù)結(jié)構(gòu),Map與其它數(shù)據(jù)結(jié)構(gòu)互相轉(zhuǎn)換操作實例詳解

    ES6中Set和Map數(shù)據(jù)結(jié)構(gòu),Map與其它數(shù)據(jù)結(jié)構(gòu)互相轉(zhuǎn)換操作實例詳解

    這篇文章主要介紹了ES6中Set和Map數(shù)據(jù)結(jié)構(gòu),Map與其它數(shù)據(jù)結(jié)構(gòu)互相轉(zhuǎn)換操作,結(jié)合實例形式詳細分析了ES6中的Set和Map數(shù)據(jù)結(jié)構(gòu)的概念、原理、遍歷、去重等操作,以及Map與其它數(shù)據(jù)結(jié)構(gòu)互相轉(zhuǎn)換操作,需要的朋友可以參考下
    2019-02-02
  • jsp 自動編譯機制詳細介紹

    jsp 自動編譯機制詳細介紹

    這篇文章主要介紹了 Jasper的自動檢測實現(xiàn)的機制比較簡單,依靠某后臺線程不斷檢測JSP文件與編譯后的class文件的最后修改時間是否相同,若相同則認為沒有改動,但倘若不同則需要重新編譯,需要的朋友可以參考下
    2016-12-12
  • Bootstrap CSS組件之按鈕下拉菜單

    Bootstrap CSS組件之按鈕下拉菜單

    這篇文章主要為大家詳細介紹了Bootstrap CSS組件之按鈕下拉菜單,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2016-12-12

最新評論