巧解 JavaScript 中的嵌套替換(強(qiáng)大正則)
更新時間:2012年09月09日 10:28:43 作者:
如何僅使用JavaScript支持的正則語法,將有嵌套的內(nèi)容替換
網(wǎng)友wys提問:如何僅使用JavaScript支持的正則語法,將
<p>
<table> <p> <p> </table>
<table> <p> <p> </table>
<p>
中<table>...</table>之間的<p>都替換為<br/>?
思考
該問題的難點(diǎn)之一在于JavaScript支持的正則特性實(shí)在有限。樓主已經(jīng)想到了非JavaScript的解法,如下:
re=/(?<=<table.*?)(<p>)(?=.*?<\/table>)/gi;
alert (sourcestr.replace(re,"<br>"));
嗯,思路大致是這樣。較真起來,即使JavaScript支持逆序環(huán)視,上面答案并不能夠如愿運(yùn)行。原因是帶有量詞的逆序環(huán)視(即在(?<=)里面使用?, *, +, {}這樣的量詞)是更高級的的語法,極少有語言能夠支持(特例是.Net)。
但是,像樓主這樣的正則問題應(yīng)該是很普便的一個問題,我們經(jīng)常需要循環(huán)地替換一些內(nèi)容。該如何解答呢?
思路一
閱讀JavaScript的文檔,我找到了lastIndex這樣的東東。根據(jù)這個東東,我形成了這樣的思路:
•先按外層循環(huán),找到第一組較大的匹配。正則代碼是<table[^>]*>[\s\S]*?<\/table>
•定位到這次匹配結(jié)束的起始位置,替換掉這一段字串中所有的<p>。
•循環(huán)執(zhí)行。
我覺得上述思路大致清晰,但是細(xì)節(jié)太多(每次匹配涉及3個位置點(diǎn),一個長度),解起來并非從容不迫,最終的代碼想必也不會賞心悅目;尤為重要的是,整個思路像是原始的 Crack,而不是高手的 Hack 。而且思路與正則關(guān)系不大。我決定換一條路。
思路二
關(guān)鍵是循環(huán)和嵌套。還好不是盜夢空間的深層遞歸。能否將匹配的內(nèi)容保護(hù)起來,替換完之后再放回原位呢?
想到這里,就豁然開朗了。
思路:先找到所有的匹配內(nèi)容,記路在數(shù)組inner中;
同時使用該正則,將原字串split為另一個數(shù)組wrapper;
一個重要的特點(diǎn)是,wrapper一定比inner多一個元素,它一一將inner項(xiàng)隔開,并處于最外層。wrapper 和 inner 的關(guān)系,就像是一個手掌的5根指頭與4個指縫的關(guān)系。將中間的元素取出,記下位置,等處理完之后,再將所有的元素粘合在一起。就是這樣簡單。代碼如下(為了讓問題更有普使性,我稍改了一下源字串):
<script type="text/javascript">
var str="<p> <table> <p> ,<p> </table> <p> <table> <p> <p> </table> <p> <table> <p> <p> </table>";
var patt=/<table[^>]*>[\s\S]*?<\/table>/i;
var wrapper_result=str.split(patt);
var inner_result = str.match(/<table[^>]*>[\s\S]*?<\/table>/ig);
var len=inner_result.length;
var final=wrapper_result[0];
for (i=0; i<len; i++)
{
tmp=inner_result[i].replace(/<p>/gi,"<br>");
final+=tmp+wrapper_result[i+1];
}
alert(final);
</script>
貼圖:

更新
果然是能人輩出,評論更精彩!請看評論中的這則代碼:
PS: 本站剛剛添加了評論中代碼的解析,可以貼代碼了。格式見評論部分的圖例顯示。謝謝合作!
復(fù)制代碼 代碼如下:
<p>
<table> <p> <p> </table>
<table> <p> <p> </table>
<p>
中<table>...</table>之間的<p>都替換為<br/>?
思考
該問題的難點(diǎn)之一在于JavaScript支持的正則特性實(shí)在有限。樓主已經(jīng)想到了非JavaScript的解法,如下:
復(fù)制代碼 代碼如下:
re=/(?<=<table.*?)(<p>)(?=.*?<\/table>)/gi;
alert (sourcestr.replace(re,"<br>"));
嗯,思路大致是這樣。較真起來,即使JavaScript支持逆序環(huán)視,上面答案并不能夠如愿運(yùn)行。原因是帶有量詞的逆序環(huán)視(即在(?<=)里面使用?, *, +, {}這樣的量詞)是更高級的的語法,極少有語言能夠支持(特例是.Net)。
但是,像樓主這樣的正則問題應(yīng)該是很普便的一個問題,我們經(jīng)常需要循環(huán)地替換一些內(nèi)容。該如何解答呢?
思路一
閱讀JavaScript的文檔,我找到了lastIndex這樣的東東。根據(jù)這個東東,我形成了這樣的思路:
•先按外層循環(huán),找到第一組較大的匹配。正則代碼是<table[^>]*>[\s\S]*?<\/table>
•定位到這次匹配結(jié)束的起始位置,替換掉這一段字串中所有的<p>。
•循環(huán)執(zhí)行。
我覺得上述思路大致清晰,但是細(xì)節(jié)太多(每次匹配涉及3個位置點(diǎn),一個長度),解起來并非從容不迫,最終的代碼想必也不會賞心悅目;尤為重要的是,整個思路像是原始的 Crack,而不是高手的 Hack 。而且思路與正則關(guān)系不大。我決定換一條路。
思路二
關(guān)鍵是循環(huán)和嵌套。還好不是盜夢空間的深層遞歸。能否將匹配的內(nèi)容保護(hù)起來,替換完之后再放回原位呢?
想到這里,就豁然開朗了。
思路:先找到所有的匹配內(nèi)容,記路在數(shù)組inner中;
同時使用該正則,將原字串split為另一個數(shù)組wrapper;
一個重要的特點(diǎn)是,wrapper一定比inner多一個元素,它一一將inner項(xiàng)隔開,并處于最外層。wrapper 和 inner 的關(guān)系,就像是一個手掌的5根指頭與4個指縫的關(guān)系。將中間的元素取出,記下位置,等處理完之后,再將所有的元素粘合在一起。就是這樣簡單。代碼如下(為了讓問題更有普使性,我稍改了一下源字串):
復(fù)制代碼 代碼如下:
<script type="text/javascript">
var str="<p> <table> <p> ,<p> </table> <p> <table> <p> <p> </table> <p> <table> <p> <p> </table>";
var patt=/<table[^>]*>[\s\S]*?<\/table>/i;
var wrapper_result=str.split(patt);
var inner_result = str.match(/<table[^>]*>[\s\S]*?<\/table>/ig);
var len=inner_result.length;
var final=wrapper_result[0];
for (i=0; i<len; i++)
{
tmp=inner_result[i].replace(/<p>/gi,"<br>");
final+=tmp+wrapper_result[i+1];
}
alert(final);
</script>
貼圖:

更新
果然是能人輩出,評論更精彩!請看評論中的這則代碼:
復(fù)制代碼 代碼如下:
alert(sourcestr.replace(/<table.*?\/table>/ig, function($1){return $1.replace(/<p>/ig,"<br>")}));
PS: 本站剛剛添加了評論中代碼的解析,可以貼代碼了。格式見評論部分的圖例顯示。謝謝合作!
您可能感興趣的文章:
- JS使用正則表達(dá)式實(shí)現(xiàn)關(guān)鍵字替換加粗功能示例
- js正則表達(dá)式replace替換變量方法
- js正則查找match()與替換replace()用法實(shí)例
- js使用正則實(shí)現(xiàn)ReplaceAll全部替換的方法
- JS利用正則配合replace替換指定字符
- js 替換功能函數(shù),用正則表達(dá)式解決,js的全部替換
- JavaScript replace(rgExp,fn)正則替換的用法
- JS、replace利用正則表達(dá)式替換SQL所有參數(shù)為指定格式的數(shù)據(jù)
- javascript replace()正則替換實(shí)現(xiàn)代碼
- js正則實(shí)現(xiàn)的密碼框簡單制作,還可以替換成自己想用得符號
- javascript用正則表達(dá)式把1234567890替換為abcdefghij
- JS使用正則表達(dá)式過濾多個詞語并替換為相同長度星號的方法
相關(guān)文章
正則表達(dá)式re.sub替換不完整的問題及完整解決方案
re.sub是個正則表達(dá)式方面的函數(shù),用來實(shí)現(xiàn)通過正則表達(dá)式,實(shí)現(xiàn)比普通字符串的replace更加強(qiáng)大的替換功能。這篇文章主要介紹了正則表達(dá)式re.sub替換不完整的問題及解決方案,需要的朋友可以參考下2018-08-08js使用正則子表達(dá)式匹配首字母與尾字母相同單詞的方法
這篇文章主要介紹了js使用正則子表達(dá)式匹配首字母與尾字母相同單詞的方法,可實(shí)現(xiàn)將多行文本框中首位字母相同的單詞進(jìn)行匹配的功能,具有一定參考借鑒價值,需要的朋友可以參考下2015-01-01正則表達(dá)式Regular Expression (RegExp)詳解
正則表達(dá)式,又稱正規(guī)表示式、正規(guī)表示法、正規(guī)表達(dá)式、規(guī)則表達(dá)式、常規(guī)表示法(英語:Regular Expression,在代碼中常簡寫為regex、regexp或RE2015-11-11JavaScript正則方法replace實(shí)現(xiàn)搜索關(guān)鍵字高亮顯示
這里介紹的是JavaScript的正則表達(dá)式的replace方法 ,和實(shí)現(xiàn)搜索關(guān)鍵字高亮的功能.先介紹一下正則表達(dá)式的replace方法,具體內(nèi)容詳情大家參考下本文2017-09-09asp.net(c#) 使用Rex正則來生成字符串?dāng)?shù)組的代碼
我們在項(xiàng)目中,經(jīng)常要使用正則表達(dá)式,現(xiàn)在有一個工具可以按正則表達(dá)式生成數(shù)據(jù).正則表達(dá)式的語法忘記了嗎?2010-05-05