Java正則表達(dá)式易錯(cuò)知識(shí)點(diǎn)匯總
一、概述
正則表達(dá)式是Java處理字符串、文本的重要工具。
Java對(duì)正則表達(dá)式的處理集中在以下兩個(gè)類:
java.util.regex.Matcher 模式類:用來表示一個(gè)編譯過的正則表達(dá)式。
java.util.regex.Pattern 匹配類:用模式匹配一個(gè)字符串所表達(dá)的抽象結(jié)果。
(很遺憾,Java Doc并沒有給出這兩個(gè)類的職責(zé)概念。)
比如一個(gè)簡單例子:
import java.util.regex.Matcher; import java.util.regex.Pattern; /** * 正則表達(dá)式例子 * * @author leizhimin 2009-7-17 9:02:53 */ public class TestRegx { public static void main(String[] args) { Pattern p = Pattern.compile("f(.+?)k"); Matcher m = p.matcher("fckfkkfkf"); while (m.find()) { String s0 = m.group(); String s1 = m.group(1); System.out.println(s0 + "||" + s1); } System.out.println("---------"); m.reset("fucking!"); while (m.find()) { System.out.println(m.group()); } Pattern p1 = Pattern.compile("f(.+?)i(.+?)h"); Matcher m1 = p1.matcher("finishabigfishfrish"); while (m1.find()) { String s0 = m1.group(); String s1 = m1.group(1); String s2 = m1.group(2); System.out.println(s0 + "||" + s1 + "||" + s2); } System.out.println("---------"); Pattern p3 = Pattern.compile("(19|20)\\d\\d([- /.])(0[1-9]|1[012])\\2(0[1-9]|[12][0-9]|3[01])"); Matcher m3 = p3.matcher("1900-01-01 2007/08/13 1900.01.01 1900 01 01 1900-01.01 1900 13 01 1900 02 31"); while (m3.find()) { System.out.println(m3.group()); } } }
輸出結(jié)果:
fck||c
fkk||k
---------
fuck
finish||in||s
fishfrish||ishfr||s
---------
1900-01-01
2007/08/13
1900.01.01
1900 01 01
1900 02 31
Process finished with exit code 0
二、一些容易迷糊的問題
1、Java對(duì)反斜線處理的問題
在其他語言中,\\表示要插入一個(gè)字符\;
在Java語言中,\\表示要插入正則表達(dá)式的反斜線,并且后面的字符有特殊意義。
a.預(yù)定義字符類
. 任何字符(與行結(jié)束符可能匹配也可能不匹配)
\d 數(shù)字:[0-9]
\D 非數(shù)字: [^0-9]
\s 空白字符:[ \t\n\x0B\f\r]
\S 非空白字符:[^\s]
\w 單詞字符:[a-zA-Z_0-9]
\W 非單詞字符:[^\w]
但是看看上面程序,對(duì)比下不難看出:
\d在實(shí)際使用的時(shí)候就寫成了 \\d;
在Java正則表達(dá)式中,如果要插入一個(gè)\字符,則需要在正則表達(dá)式中寫成\\\\,原因是下面的APIDoc定義\\表示一個(gè)反斜線。
但是如果在正則表示式中表示回車換行等,則不需要多添加反斜線了。比如回車\r就寫作\r.
b.字符
x 字符 x
\\ 反斜線字符
\0n 帶有八進(jìn)制值 0 的字符 n (0 <= n <= 7)
\0nn 帶有八進(jìn)制值 0 的字符 nn (0 <= n <= 7)
\0mnn 帶有八進(jìn)制值 0 的字符 mnn(0 <= m <= 3、0 <= n <= 7)
\xhh 帶有十六進(jìn)制值 0x 的字符 hh
\uhhhh 帶有十六進(jìn)制值 0x 的字符 hhhh
\t 制表符 ('\u0009')
\n 新行(換行)符 ('\u000A')
\r 回車符 ('\u000D')
\f 換頁符 ('\u000C')
\a 報(bào)警 (bell) 符 ('\u0007')
\e 轉(zhuǎn)義符 ('\u001B')
\cx 對(duì)應(yīng)于 x 的控制符
2、Matcher.find():嘗試查找與模式匹配的字符序列的下一個(gè)子序列。此方法從字符序列的開頭開始,如果該方法的前一次調(diào)用成功了并且從那時(shí)開始匹配器沒有被重置,則從以前匹配操作沒有匹配的第一個(gè)字符開始,即如果前一次找到與模式匹配的子序列則這次從這個(gè)子序列后開始查找。
3、Matcher.matchers():判斷整個(gè)字符序列與模式是否匹配。當(dāng)連續(xù)用Matcher對(duì)象檢查多個(gè)字符串時(shí)候,可以使用
Matcher.reset():重置匹配器,放棄其所有顯式狀態(tài)信息并將其添加位置設(shè)置為零。
或者M(jìn)atcher.reset(CharSequence input) 重置此具有新輸入序列的匹配器,來重復(fù)使用匹配器。
4、組的概念,這個(gè)概念很重要,組是用括號(hào)劃分的正則表達(dá)式,可以通過編號(hào)來引用組。組號(hào)從0開始,有幾對(duì)小括號(hào)就表示有幾個(gè)組,并且組可以嵌套,組號(hào)為0的表示整個(gè)表達(dá)式,組號(hào)為1的表示第一個(gè)組,依此類推。
例如:A(B)C(D)E正則式中有三組,組0是ABCDE,組1是B,組2是D;
A((B)C)(D)E正則式中有四組:組0是ABCDE,組1是BC,組2是B;組3是C,組4是D。
int groupCount():返回匹配其模式中組的數(shù)目,不包括第0組。
String group():返回前一次匹配操作(如find())的第0組。
String group(int group):返回前一次匹配操作期間指定的組所匹配的子序列。如果該匹配成功,但指定組未能匹配字符序列的任何部分,則返回 null。
int start(int group):返回前一次匹配操作期間指定的組所匹配的子序列的初始索引。
int end(int group):返回前一次匹配操作期間指定的組所匹配的子序列的最后索引+1。
5、匹配的范圍的控制
最變態(tài)的就要算lookingAt()方法了,名字很讓人迷惑,需要認(rèn)真看APIDoc。
start() 返回以前匹配的初始索引。
end() 返回最后匹配字符之后的偏移量。
public boolean lookingAt()嘗試將從區(qū)域開頭開始的輸入序列與該模式匹配。
與 matches 方法類似,此方法始終從區(qū)域的開頭開始;與之不同的是,它不需要匹配整個(gè)區(qū)域。
如果匹配成功,則可以通過 start、end 和 group 方法獲取更多信息。
返回:
當(dāng)且僅當(dāng)輸入序列的前綴匹配此匹配器的模式時(shí)才返回 true。
小編為大家整理了這些易混知識(shí)點(diǎn),但是還是不夠全面,需要大家在之后的學(xué)習(xí)中不斷積累,正則表達(dá)式最大的難點(diǎn)在于熟練書寫正則表達(dá)式,大家應(yīng)該針對(duì)難點(diǎn)進(jìn)行學(xué)習(xí),相信一定會(huì)有所收獲。
- java正則表達(dá)式四種常用的處理方式(匹配、分割、替代、獲?。?/a>
- 實(shí)例解析Java程序中正則表達(dá)式的貪婪模式匹配
- Java編程中正則表達(dá)式的用法總結(jié)
- java常用正則表達(dá)式
- java正則表達(dá)式學(xué)習(xí)筆記之命名捕獲
- Java正則表達(dá)式提取字符的方法實(shí)例
- 學(xué)習(xí)Java正則表達(dá)式(匹配、替換、查找)
- 詳解Java正則表達(dá)式語法
- Java正則表達(dá)式入門學(xué)習(xí)
- Java正則表達(dá)式匹配電話格式
- Java用正則表達(dá)式如何讀取網(wǎng)頁內(nèi)容
- Java 正則表達(dá)式詳細(xì)介紹
相關(guān)文章
SpringBoot實(shí)現(xiàn)過濾器和攔截器的方法
大家應(yīng)該都曉得實(shí)現(xiàn)過濾器需要實(shí)現(xiàn)?javax.servlet.Filter?接口,而攔截器會(huì)在處理指定請(qǐng)求之前和之后進(jìn)行相關(guān)操作,配置攔截器需要兩步,本文通過實(shí)例代碼給大家介紹SpringBoot?過濾器和攔截器的相關(guān)知識(shí),感興趣的朋友一起看看吧2022-11-11jcl與jul?log4j1?log4j2?logback日志系統(tǒng)機(jī)制及集成原理
這篇文章主要介紹了jcl與jul?log4j1?log4j2?logback的集成原理,Apache?Commons-logging?通用日志框架與日志系統(tǒng)的機(jī)制,有需要的朋友可以借鑒參考下2022-03-03Zookeeper連接超時(shí)問題與拒絕連接的解決方案
今天小編就為大家分享一篇關(guān)于Zookeeper連接超時(shí)問題與拒絕連接的解決方案,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧2019-03-03mybatis中sql語句CDATA標(biāo)簽的用法說明
這篇文章主要介紹了mybatis中sql語句CDATA標(biāo)簽的用法說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-06-06Spring Data Jpa 自動(dòng)生成表結(jié)構(gòu)的方法示例
這篇文章主要介紹了Spring Data Jpa 自動(dòng)生成表結(jié)構(gòu)的方法示例,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-04-04Java中Excel高效解析工具EasyExcel的實(shí)踐
EasyExcel是阿里巴巴開源的一個(gè)excel處理框架,已使用簡單,節(jié)省內(nèi)存著稱,下面這篇文章主要給大家介紹了關(guān)于Java中Excel高效解析工具EasyExcel實(shí)踐的相關(guān)資料,需要的朋友可以參考下2022-04-04Springboot 讀取自定義pro文件注入static靜態(tài)變量方式
這篇文章主要介紹了Springboot 讀取自定義pro文件注入static靜態(tài)變量方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-07-07