CFC4N小試php正則表達(dá)式
其字符串為
Array
(
[tt] => Array
(
[table] => qqttcode
[hitcode] => 1
)
[ww] => Array
(
[table] => qqwwcode
[hitcode] =>
)
[pp] => Array
(
[table] => qqppcode
[hitcode] => Array
(
[table] => qqppcode
[hitcode] =>
)
)
)
CFC4N給出一下結(jié)果:
$strRge1 = '/(\[([^]]+)]\s?=>\s?)?Array[\s\S]+?\(([^()]|(?R))*\)/i';
$arrReturn = array();
if (preg_match_all($strRge1,$str,$tt1))
{
$arrReturn = getarray($tt1[0][0]);
}
$arrReturn2 = array();
foreach ($arrReturn as $k => $v)
{
$arrReturn2[$k] = $v[$k];
}
print_r($arrReturn2);
function getarray ($strContents)
{
$arrTemp = array();
$strRge = '/\[([^]]+)]\s?=>\s?Array[\s\S]+?\(([^()]|(?R))*\)/i';
$strReg2 = '/\[([^]]+?)]\s?=>\s?([\d\w]+)?/';
if (preg_match_all($strRge,$strContents,$strTemp))
{
$num = count($strTemp[1]);
if ($num > '1')
{
for ($i=0; $i<$num; $i++)
{
if (preg_match_all($strRge,$strTemp[0][$i],$arrTTT))
{
$arrTemp[$strTemp[1][$i]] = array();
$arrTemp[$strTemp[1][$i]] = getarray($strTemp[0][$i]);
}
else
{
$arrTemp[$strTemp[1][$i]] = $strTemp[0][$i];
}
}
}
else
{
$arrTemp[$strTemp[1][0]] = array();
$arrTemp2 = array();
if (preg_match_all($strReg2, $strTemp[0][0],$straa))
{
$num = count($straa[0]);
for ($i=0; $i<$num-1; $i++)
{
$arrTemp2[$straa[1][$i+1]] = $straa[2][$i+1];
}
}
$arrTemp[$strTemp[1][0]] = $arrTemp2;
}
}
return $arrTemp;
}
結(jié)果是可以用的。但是發(fā)現(xiàn)其只能用于固定的三層嵌套,假如N層的話,無法用這個(gè)函數(shù)了,后來,我又改造一下那個(gè)正則,改為
$strRge1 = '/\[(([^]]+)]\s?=>\s?Array[\s]+?\(([^()])+|(?R))\)+/i';
但是,并不能解決問題。。各位看官,您認(rèn)為,我的誤區(qū)在哪里呢?
附 第一個(gè)正則截圖

更改后正則匹配截圖

朋友乙:要求批量給html字符串中a標(biāo)簽中不包含title屬性的標(biāo)簽添加title,而且,其title內(nèi)容為<a href…>到</a>之間的文本。。
CFC4N給出答案為:
$str = '<a >ssss</a><a href="ss" >ssss</a><a title="ss" >ssss</a><a href="">ssss</a><a title="ss">ssss</a><a title="ss">ssss</a><a title="ssf">ssss</a>';
$str = preg_replace('%<a((?:(?!title="[^"]+?")[\s\S])+?)>(?:(?<!</a>)[\s\S])+?</a>%im','<a title="\\2" \\1>\\2</a>',$str);
print_r($str);
$str = '<a >ssss</a><a href="ss" >ssss</a><a title="ss" >ssss</a><a href="">ssss</a><a title="ss">ssss</a><a title="ss">ssss</a><a title="ssf">ssss</a>';
$str = preg_replace('%<a((?:(?!title="[^"]+?")[\s\S])+?)>(?:(?<!</a>)[\s\S])+?</a>%im','<a title="\\2" \\1>\\2</a>',$str);
print_r($str);
各位看官,您認(rèn)為,CFC4N寫的正則表達(dá)式里,哪些還可以優(yōu)化呢?這個(gè)效率是不是不高??
朋友丙:要求過濾非本域名,或者非本子域名的其他域名的UBB標(biāo)簽鏈接,一旦包含,直接替換成其中間的文本,比如例子字符串如下
[url=http://www.sadas.cn]baidu[/url]
[url=www.ggasdwe.com]百度[/url]
[url=http://www.qq.com/index.php]QQ[/url]
[url=http://www.miyifun.com/index.html]其他
[/url]
[url=pc.qq.com/index.php]PC QQ[/url]
其中,字符串中不確定有幾個(gè)換行等其他字符,而且,不確定url的UBB標(biāo)簽中的網(wǎng)址中是否包含http://,不確定二級(jí)域名或者三級(jí)域名
CFC4N給出的正則以及PHP代碼如下
$str = '[url=http://www.sadas.cn]baidu[/url]
[url=www.ggasdwe.com]百度[/url]
[url=http://www.qq.com/index.php]QQ[/url]
[url=http://www.miyifun.com/index.html]其他
[/url]
[url=pc.qq.com/index.php]PC QQ[/url]';
print_r(preg_replace('%\[url=(http://)?(?:(?!qq\.com)[^\]])*\][\r|\r\n]*([\s\S]+?)[\r|\r\n]*\[/url\]%i','\\2',$str));
各位看官,您認(rèn)為這里哪里是多余的?還可以進(jìn)行哪些正則的優(yōu)化來提高效率?如果沒看懂,那您的疑問在哪里?
朋友丁:要求讀取squid的配置文件中,起作用的行,也就是沒有#開頭進(jìn)行注釋的行。
其中,squid的配置文件內(nèi)字符串見附件中
squid的配置文件內(nèi)容
CFC4N給出正則代碼如下
preg_match_all('/^(?!#).+?$/m', file_get_contents('squid.conf'), $regs);
print_r($regs[0]);
運(yùn)行截圖

看官們,您認(rèn)為,這個(gè)正則還有哪些沒注意到的點(diǎn)?能否正確無誤的匹配到朋友丁所需要的內(nèi)容?您有疑問嗎?
PS:以上正則,均為PCRE引擎。。其中,PHP代碼的正則遞歸(迭代)部分,僅限于支持遞歸正則的引擎代碼適用。。
感謝rex老大指點(diǎn)關(guān)于(?!)零寬斷言非匹配的特性后接匹配規(guī)則可能無效的問題。
相關(guān)文章
Python 正則表達(dá)式匹配數(shù)字及字符串中的純數(shù)字
這篇文章主要介紹了Python 正則表達(dá)式匹配數(shù)字及使用正則表達(dá)式找出字符串中的純數(shù)字,非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-08-08正則表達(dá)式從HTML中匹配img標(biāo)簽的圖片地址
最近有一個(gè)項(xiàng)目要獲取頁面中所有img標(biāo)簽中的圖片地址,這篇文章主要給大家介紹了關(guān)于正則表達(dá)式如何從HTML中匹配img標(biāo)簽的圖片地址的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-09-09JavaScript 實(shí)現(xiàn)基礎(chǔ) 正則表達(dá)式
正則表達(dá)式用來從某一段字符串中匹配所需要的字符,這些字符可以非常簡單,也可以非常復(fù)雜。JavaScript生來就對(duì)正則表達(dá)式有著良好的支持,在網(wǎng)絡(luò)的字符搜索匹配中發(fā)揮著重要的作用。2009-08-08javascript中10個(gè)正則表達(dá)式使用介紹基礎(chǔ)篇
本文通過舉例簡單的介紹了正則表達(dá)式的一些使用方法,能夠助力你快速入門正則表達(dá)式,希望這篇正則總結(jié)方法能對(duì)你有用2020-02-02