正則表達式教程之操作符及說明詳解
本文實例講述了正則表達式中的操作符及說明。分享給大家供大家參考,具體如下:
一、普通字符
包括所有未顯式指定為元字符的打印和非打印字符組成,如大小寫字母、數(shù)字、標(biāo)點符號等。
二、元字符
元字符是一些在正則表達式里有著特殊含義的字符。因為元字符在正則表達式里有著特殊的含義,所以這些字符不能用來代表它們本身,必須通過給它加個反斜杠前綴來轉(zhuǎn)義,如此得到的轉(zhuǎn)義序列將匹配那個字符本身而不是它特殊的元字符含義。如[表示一個字符集合的開始,如果在正則表達式中要匹配[,那么需要這樣引用:\[,才能表示[本身。
^ | 匹配輸入字符串的開始位置,除非在方括號表達式中使用,此時它表示不接受該字符集合。要匹配 ^ 字符本身,請使用 \^。 |
$ | 匹配輸入字符串的結(jié)尾位置。如果設(shè)置多行匹配,則 $ 也匹配 '\n' 或 '\r'。要匹配 $ 字符本身,請使用 \$。 |
() | 標(biāo)記一個子表達式的開始和結(jié)束位置。子表達式可以獲取供以后使用。要匹配這些字符,請使用 [Math Processing Error]。 |
? | 匹配前面的子表達式零次或一次,或指明一個非貪婪限定符。要匹配 ? 字符,請使用 \?。 |
* | 匹配前面的子表達式零次或多次。要匹配 * 字符,請使用 \*。 |
+ | 匹配前面的子表達式一次或多次。要匹配 + 字符,請使用 \+。 |
. | 匹配除換行符 \n之外的任何單字符。要匹配 .,請使用 \。 |
[] | 標(biāo)記一個字符集合的開始和結(jié)束。要匹配 [或],請使用 [Math Processing Error]。 |
\ | 將下一個字符標(biāo)記為特殊字符、或原義字符、或向后引用、或八進制轉(zhuǎn)義符。例如, 'n' 匹配字符 'n'。'\n' 匹配換行符。序列 '\\' 匹配 "\",而 '\(' 則匹配 "("。 |
| | 指明兩項之間的一個選擇。要匹配 |,請使用 \|。 |
{} | 標(biāo)記限定符表達式的開始和結(jié)束。要匹配 {或},請使用 \{或\}。 |
三、非打印字符
\cx | 匹配由x指明的控制字符。例如, \cM 匹配一個 Control-M 或回車符。x 的值必須為 A-Z 或 a-z 之一。否則,將 c 視為一個原義的 'c' 字符。 |
\f | 匹配一個換頁符。等價于 \x0c 和 \cL。 |
\n | 匹配一個換行符。等價于 \x0a 和 \cJ。 |
\r | 匹配一個回車符。等價于 \x0d 和 \cM。 |
\t | 匹配一個制表符。等價于 \x09 和 \cI。 |
\v | 匹配一個垂直制表符。等價于 \x0b 和 \cK。 |
四、預(yù)定義字符
. | 任何字符(與結(jié)束符\r\n可能匹配也可能不匹配) |
\d | 數(shù)字,等價于[0-9] |
\D | 非數(shù)字,等價于[^0-9] |
\s | 空白字符,等價于[ \t\n\x0B\f\r] |
\S | 非空白字符,等價于[^\s] |
\w | 單詞字符,等價于[a-zA-Z_0-9] |
\W | 非單詞字符,等價于[^\w] |
\b | 單詞的前或后邊界 |
\B | 表示非單詞邊界 |
五、POSIX 字符
[:alnum:] | 任何一個字母或數(shù)字,等價于[a-zA-Z0-9] |
[:alpha:] | 任何一個字母,等價于[a-zA-Z] |
[:blank:] | 空格或制表符,等價于[\t] |
[:cntrl:] | ASCII控制字符(ASCII 0到31,再加上ASCII127) |
[:digit:] | 任何一個數(shù)字,等價于[0-9] |
[:graph:] | 任何一個可打印字符,但不包括空格 |
[:lower:] | 任何一個小寫字母,等價于[a-z] |
[:print:] | 任何一個可打印字符 |
[:punct:] | 既不屬于[:alnum:]和[:cntrl:]的任何一個字符 |
[:space:] | 任何一個空白字符,包括空格,等價于[^\f\n\r\t\v] |
[:upper:] | 任何一個大寫字母,等價于[A-Z] |
[:xdigit:] | 任何一個十六進制數(shù)字,等價于[a-fA-F0-9] |
六、限定符
* | 匹配前面的子表達式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等價于{0,}。 |
+ | 匹配前面的子表達式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價于{1,}。 |
? | 匹配前面的子表達式零次或一次。例如,"do(es)?"可以匹配 "do" 或"does" 中的"do" 。? 等價于 {0,1}。 |
{n} | n 是一個非負(fù)整數(shù)。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。 |
{n,} | n 是一個非負(fù)整數(shù)。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。 |
{n,m} | m 和 n 均為非負(fù)整數(shù),其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價于 'o?'。請注意在逗號和兩個數(shù)之間不能有空格。 |
這里只是按照功能的不同來對正則表達式中用到的一些操作符進行分類,不一定準(zhǔn)確,只是為了說明正則表達式中的操作符。
PS:這里再為大家提供2款非常方便的正則表達式工具供大家參考使用:
JavaScript正則表達式在線測試工具:
http://tools.jb51.net/regex/javascript
正則表達式在線生成工具:
http://tools.jb51.net/regex/create_reg
希望本文所述對大家正則表達式的學(xué)習(xí)有所幫助。
相關(guān)文章
asp提取內(nèi)容中的手機號碼,qq,網(wǎng)址的正則代碼
有時候需要獲取頁面源代碼中的手機號碼,qq,網(wǎng)址,一般情況下都是用正則表達式實現(xiàn)的,需要的朋友可以參考下。2011-09-09用正則表達式判斷字符串是漢字還是拼音的js函數(shù)代碼
用正則表達式判斷字符串是漢字還是拼音的js函數(shù)代碼,需要的朋友可以參考下。2011-07-07