python正則表達(dá)式修復(fù)網(wǎng)站文章字體不統(tǒng)一的解決方法
網(wǎng)站的大框架下有定義的字體,包括字體大小和顏色等,用戶發(fā)布文章的時(shí)候可能是從其他網(wǎng)站復(fù)制過(guò)來(lái)的文本,復(fù)制的過(guò)程也保留了字體描述信息。當(dāng)文章在頁(yè)面上顯示的時(shí)候,默認(rèn)先會(huì)使用文章中定義的字體,如果文章中字體不存在的話才顯示大框架下定義的全局字體。因此網(wǎng)站的內(nèi)容就會(huì)顯得很亂,有的文章字體很大,有的文章字體很小,不美觀。能統(tǒng)一的話就好了!
我對(duì)html和css等不是很熟,不知道是否能設(shè)置一下讓文章中定義的字體內(nèi)容失效。
笨人有笨辦法,統(tǒng)一修改文章,將用戶的對(duì)字體的定義全部刪除!哈哈!如果手工完成的話,這可是一個(gè)相當(dāng)繁重的任務(wù),要首先預(yù)覽頁(yè)面,如果不統(tǒng)一的話就修改字體,幸好編輯器里面有個(gè)“清除格式”選項(xiàng),全選文本,點(diǎn)一下就OK了,然后再保存……也很麻煩
如果僅僅是修改字體的話,最省事的方法當(dāng)然是直接修改數(shù)據(jù)庫(kù),從數(shù)據(jù)庫(kù)將文章提取出來(lái),刪除和字體相關(guān)的標(biāo)簽,然后再寫(xiě)回?cái)?shù)據(jù)庫(kù)。
專門(mén)查了一下html參考手冊(cè),對(duì)字體的定義有兩種方法:
1.是用<font>標(biāo)簽,例如:
<p>
<font size="2" face="Verdana">
This is a paragraph.
</font>
</p>
<p>
<font size="3" face="Times">
This is another paragraph.
</font>
</p>
這種方法是不推薦使用的
2.使用style定義,例如:
<p style="font-family:verdana;font-size:80%;color:green">
This is a paragraph with some text in it. This is a paragraph with some text in it. This is a paragraph with some text in it. This is a paragraph with some text in it.
</p>
只要將字體的定義部分刪除就可以了,用python的正則表達(dá)式模塊進(jìn)行替換無(wú)壓力:
def format(data):
'''將font標(biāo)簽和style標(biāo)簽全部刪除'''
p = re.compile(r'<font .*?>|</font>|style=\".*?\"')
ret = p.sub('',data)
if ret != data:
return retelse:
return None
python處理數(shù)據(jù)庫(kù)相關(guān)操作時(shí)要注意更新數(shù)據(jù)方法,可以參考這篇文章:http://www.cnblogs.com/ma6174/archive/2013/02/21/2920126.html
- python的正則表達(dá)式re模塊的常用方法
- 零基礎(chǔ)寫(xiě)python爬蟲(chóng)之神器正則表達(dá)式
- Python正則表達(dá)式匹配ip地址實(shí)例
- python使用正則搜索字符串或文件中的浮點(diǎn)數(shù)代碼實(shí)例
- python使用正則表達(dá)式檢測(cè)密碼強(qiáng)度源碼分享
- python正則表達(dá)式re模塊詳細(xì)介紹
- python正則匹配查詢港澳通行證辦理進(jìn)度示例分享
- Python查找相似單詞的方法
- python實(shí)現(xiàn)在目錄中查找指定文件的方法
- python腳本實(shí)現(xiàn)查找webshell的方法
- python通過(guò)正則查找微博@(at)用戶的方法
相關(guān)文章
pytorch 把圖片數(shù)據(jù)轉(zhuǎn)化成tensor的操作
這篇文章主要介紹了pytorch 把圖片數(shù)據(jù)轉(zhuǎn)化成tensor的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03Python 實(shí)現(xiàn)國(guó)產(chǎn)SM3加密算法的示例代碼
這篇文章主要介紹了Python 實(shí)現(xiàn)國(guó)產(chǎn)SM3加密算法的示例代碼,幫助大家更好的理解和學(xué)習(xí)密碼學(xué),感興趣的朋友可以了解下2020-09-09使用Gitee自動(dòng)化部署python腳本的詳細(xì)過(guò)程
小編最近在自學(xué)python,在學(xué)習(xí)過(guò)程中有好多意向不到的收獲,真的很開(kāi)心,今天重點(diǎn)給大家分享使用Gitee自動(dòng)化部署python腳本的詳細(xì)過(guò)程,包括安裝環(huán)境搭建及一些注意事項(xiàng),感興趣的朋友跟隨小編一起看看吧2021-05-05使用Python正則表達(dá)式操作文本數(shù)據(jù)的方法
這篇文章主要介紹了使用Python正則表達(dá)式操作文本數(shù)據(jù)的方法,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2019-05-05教你用python編寫(xiě)腳本實(shí)現(xiàn)自動(dòng)簽到
這篇文章主要介紹了教你怎樣用python編寫(xiě)腳本實(shí)現(xiàn)自動(dòng)簽到,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-08-08