asp 使用正則表達(dá)式替換word中的標(biāo)簽,轉(zhuǎn)為純文本
更新時(shí)間:2010年04月28日 22:35:48 作者:
asp里使用正則表達(dá)式清除后臺(tái)編輯器里復(fù)制粘貼內(nèi)容的word格式,將其轉(zhuǎn)換成純文本
公司客戶在使用網(wǎng)站后臺(tái)編輯添加修改內(nèi)容時(shí),經(jīng)常是直接從word文檔里復(fù)制內(nèi)容到編輯器里后就提交。結(jié)果是在內(nèi)容顯示頁(yè)面上是五花八門(mén)的樣式,有時(shí)也需要部分純文本內(nèi)容作為摘錄使用,這些都需要清除word格式。改變客戶的習(xí)慣要客戶先復(fù)制到記事本里再粘貼到編輯器里編輯是很難的,所以從我們自己改變起。從網(wǎng)上百度了若干清除word格式的正則,使用效果不甚理想,所以自己寫(xiě)了清除word格式的asp函數(shù),能滿足我們自己的使用需求。函數(shù)如下:
function cleanWord(html)
dim regEx
set regEx=New RegExp
regEx.IgnoreCase=True
regEx.Global=True
regEx.Pattern="<[^>]*>" '清除所有<>之間的內(nèi)容
html = regEx.replace(html,"" )
regEx.Pattern="{[^}]*}" '清除所有{}之間的內(nèi)容
html = regEx.replace(html,"" )
regEx.Pattern="/[^/]*/" '清除所有/**/之間的注釋
html = regEx.replace(html,"" )
html =Replace(html,"table.MsoNormalTable","") '替換掉漏網(wǎng)的單詞
cleanWord= html
set regEx=nothing
end function
復(fù)制代碼 代碼如下:
function cleanWord(html)
dim regEx
set regEx=New RegExp
regEx.IgnoreCase=True
regEx.Global=True
regEx.Pattern="<[^>]*>" '清除所有<>之間的內(nèi)容
html = regEx.replace(html,"" )
regEx.Pattern="{[^}]*}" '清除所有{}之間的內(nèi)容
html = regEx.replace(html,"" )
regEx.Pattern="/[^/]*/" '清除所有/**/之間的注釋
html = regEx.replace(html,"" )
html =Replace(html,"table.MsoNormalTable","") '替換掉漏網(wǎng)的單詞
cleanWord= html
set regEx=nothing
end function
相關(guān)文章
asp實(shí)現(xiàn)的sha1加密解密代碼(和C#兼容)
這篇文章主要介紹了asp實(shí)現(xiàn)的sha1加密解密代碼,可以和ASP.NET(C#)相互兼容,需要的朋友可以參考下2014-08-08在線掃描探測(cè)檢查asp站點(diǎn)木馬后門(mén)的程序
在線掃描探測(cè)檢查asp站點(diǎn)木馬后門(mén)的程序...2007-03-03利用AdoDb.Stream對(duì)象來(lái)讀取UTF-8格式的文本文件
利用AdoDb.Stream對(duì)象來(lái)讀取UTF-8格式的文本文件...2006-10-10ASP生成隨機(jī)數(shù) ASP生成不重復(fù)隨機(jī)數(shù)
這篇文章主要介紹了ASP生成不重復(fù)隨機(jī)數(shù)的方法,需要的朋友可以參考下2014-05-05asp中讓function同時(shí)返回多個(gè)值的代碼
asp中讓function同時(shí)返回多個(gè)值的代碼,需要的朋友可以參考下。2011-02-02非常不錯(cuò)的ASP+Access數(shù)據(jù)庫(kù)的終極安全大法18則
非常不錯(cuò)的ASP+Access數(shù)據(jù)庫(kù)的終極安全大法18則...2007-06-06Coolite 中前臺(tái)獲取 GridPanel 當(dāng)前選擇行值的代碼
掌握獲取 GridPanel 當(dāng)前行的各個(gè)字段值的方法,需要的朋友可以參考下。2010-06-06