preg_match_all使用心得分享
preg_match_all — 進行全局正則表達式匹配
說明
int preg_match_all ( string pattern, string subject, array matches [, int flags] )
在 subject 中搜索所有與 pattern 給出的正則表達式匹配的內(nèi)容并將結(jié)果以 flags 指定的順序放到 matches 中。
搜索到第一個匹配項之后,接下來的搜索從上一個匹配項末尾開始。
特別注意PREG_PATTERN_ORDER 和PREG_SET_ORDER
flags 可以是下列標記的組合(注意把 PREG_PATTERN_ORDER 和 PREG_SET_ORDER 合起來用沒有意義):
如果使用PREG_PATTERN_ORDER
對結(jié)果排序使 $matches[0] 為全部模式匹配的數(shù)組,$matches[1] 為第一個括號中的子模式所匹配的字符串組成的數(shù)組,以此類推。(即$matches[0] [0]為全部模式匹配中的每一項,$matches[0] [1]為全部模式匹配中的第二項,$matches[1] [0]為匹配每一個括號中的第一項,$matches[1] [0]為匹配每一個括號中的第二項)
<?php
preg_match_all ("|<[^>]+>(.*)</[^>]+>|U","<b>example: </b><div align=left>this is a test</div>",$out, PREG_PATTERN_ORDER);
print $out[0][0].", ".$out[0][1]."\n";
print $out[1][0].", ".$out[1][1]."\n";
?>
本例將輸出:
<b>example: </b>, <div align=left>this is a test</div>
example: , this is a test
因此,$out[0] 包含匹配整個模式的字符串,$out[1] 包含一對 HTML 標記之間的字符串。
如果使用PREG_SET_ORDER
對結(jié)果排序使 $matches[0] 為第一組匹配項的數(shù)組,$matches[1] 為第二組匹配項的數(shù)組,以此類推。(即$matches[0] [0]為第一組匹配項中完整匹配的字符串,$matches[0] [1]為第一組匹配中完整匹配第一個括號中的字符串)
<?php
preg_match_all ("|<[^>]+>(.*)</[^>]+>|U","<b>example: </b><div align=left>this is a test</div>",$out, PREG_SET_ORDER);
print $out[0][0].", ".$out[0][1]."\n";
print $out[1][0].", ".$out[1][1]."\n";
?>
本例將輸出:
<b>example: </b>, example:
<div align=left>this is a test</div>, this is a test
本例中,$matches[0] 是第一組匹配結(jié)果,$matches[0][0] 包含匹配整個模式的文本,$matches[0][1] 包含匹配第一個子模式的文本,以此類推。同樣,$matches[1] 是第二組匹配結(jié)果,等等。
PREG_OFFSET_CAPTURE
如果設(shè)定本標記,對每個出現(xiàn)的匹配結(jié)果也同時返回其附屬的字符串偏移量。注意這改變了返回的數(shù)組的值,使其中的每個單元也是一個數(shù)組,其中第一項為匹配字符串,第二項為其在 subject 中的偏移量。本標記自 PHP 4.3.0 起可用。
如果沒有給出標記,則假定為 PREG_PATTERN_ORDER。
返回整個模式匹配的次數(shù)(可能為零),如果出錯返回 FALSE。
例子 1. 從某文本中取得所有的電話號碼
<?php
preg_match_all ("/\(? (\d)? \)? (?(1) [\-\s] ) \d-\d/x","Call 555-1212 or 1-800-555-1212", $phones);
?>
例子 2. 搜索匹配的 HTML 標記(greedy)
<?php
// \\2 是一個逆向引用的例子,其在 PCRE 中的含義是
// 必須匹配正則表達式本身中第二組括號內(nèi)的內(nèi)容,本例中
// 就是 ([\w]+)。因為字符串在雙引號中,所以需要
// 多加一個反斜線。
$html = "<b>bold text</b><a href=howdy.html>click me</a>";
preg_match_all ("/(<([\w]+)[^>]*>)(.*)(<\/\\2>)/", $html, $matches);
for ($i=0; $i< count($matches[0]); $i++) {
echo "matched: ".$matches[0][$i]."\n";
echo "part 1: ".$matches[1][$i]."\n";
echo "part 2: ".$matches[3][$i]."\n";
echo "part 3: ".$matches[4][$i]."\n\n";
}
?>
本例將輸出:
matched: <b>bold text</b>
part 1: <b>
part 2: bold text
part 3: </b>
matched: <a href=howdy.html>click me</a>
part 1: <a href=howdy.html>
part 2: click me
part 3: </a>
- 基于preg_match_all采集后數(shù)據(jù)處理的一點心得筆記(編碼轉(zhuǎn)換和正則匹配)
- PHP函數(shù)preg_match_all正則表達式的基本使用詳細解析
- php小經(jīng)驗:解析preg_match與preg_match_all 函數(shù)
- php中使用preg_match_all匹配文章中的圖片
- PHP 正則表達式之正則處理函數(shù)小結(jié)(preg_match,preg_match_all,preg_replace,preg_split)
- php preg_match_all結(jié)合str_replace替換內(nèi)容中所有img
相關(guān)文章
PHP入門教程之數(shù)組用法匯總(創(chuàng)建,刪除,遍歷,排序等)
這篇文章主要介紹了PHP入門教程之數(shù)組用法,結(jié)合大量實例總結(jié)分析了php關(guān)于數(shù)組的創(chuàng)建、打印、遍歷、獲取、排序、插入、刪除等常見操作技巧,需要的朋友可以參考下2016-09-09php源碼分析之DZX1.5隨機數(shù)函數(shù)random用法
這篇文章主要介紹了php源碼分析之DZX1.5隨機數(shù)函數(shù)random用法,實例分析了DZX1.5中random函數(shù)生成隨機字符串的使用技巧,需要的朋友可以參考下2015-06-06PHP函數(shù)extension_loaded()用法實例
這篇文章主要介紹了PHP函數(shù)extension_loaded()用法,實例分析了函數(shù)extension_loaded()檢查一個擴展是否已經(jīng)加載的具體用法,并補充說明了查看本機已加載php擴展的方法,需要的朋友可以參考下2015-01-01屏蔽機器人從你的網(wǎng)站搜取email地址的php代碼
屏蔽機器人從你的網(wǎng)站搜取email地址然后發(fā)垃圾郵件的處理方法,需要的朋友可以參考下2012-11-11PHP和Selenium搭建高效網(wǎng)絡(luò)爬蟲實現(xiàn)技術(shù)探索
隨著信息時代的到來,網(wǎng)站被認為是獲取信息的主要途徑之一,但是,手動獲取網(wǎng)站上的信息是非常繁瑣的,因此出現(xiàn)了自動抓取網(wǎng)頁的方式——網(wǎng)絡(luò)爬蟲,這篇文章將介紹如何使用PHP和Selenium搭建一個高效的網(wǎng)絡(luò)爬蟲來自動收集信息2024-01-01ThinkPHP6使用最新版本Endroid/QrCode生成二維碼的方法實例
這篇文章主要介紹了ThinkPHP6使用最新版本Endroid/QrCode生成二維碼的方法,結(jié)合實例形式詳細分析了ThinkPHP6使用最新版本Endroid/QrCode生成二維碼具體步驟、原理、實現(xiàn)方法與相關(guān)注意事項,需要的朋友可以參考下2023-07-07php在apache環(huán)境下實現(xiàn)gzip配置方法
這篇文章主要介紹了php在apache環(huán)境下實現(xiàn)gzip配置方法,較為詳細的分析了相關(guān)配置文件的修改技巧,非常具有實用價值,需要的朋友可以參考下2015-04-04