python實現(xiàn)html轉(zhuǎn)ubb代碼(html2ubb)
更新時間:2014年07月03日 09:18:04 作者:leo108
這篇文章主要介紹了python實現(xiàn)html轉(zhuǎn)ubb代碼(html2ubb),使用正則表達式寫的一個函數(shù),需要的朋友可以參考下
這兩天在用python寫一個采集器,有個功能模塊是html代碼轉(zhuǎn)換為ubb,網(wǎng)上貌似沒有現(xiàn)成程序,就自己寫了個函數(shù),順便鍛煉下自己的正則。
import re def Html2UBB(content): #以下是將html標簽轉(zhuǎn)為ubb標簽 pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I) content = pattern.sub(r'[url=1]2[/url]',content) pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I) content = pattern.sub(r'[img]1[/img]',content) pattern = re.compile( '<strong>([sS]+?)</strong>',re.I) content = pattern.sub(r'[b]1[/b]',content) pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I) content = pattern.sub(r'[1]2[/1]',content) pattern = re.compile( '<[^>]*?>',re.I) content = pattern.sub('',content) #以下是將html轉(zhuǎn)義字符轉(zhuǎn)為普通字符 content = content.replace('<','<') content = content.replace('>','>') content = content.replace('”','”') content = content.replace('“','“') content = content.replace('"','"') content = content.replace('©','©') content = content.replace('®','®') content = content.replace(' ',' ') content = content.replace('—','—') content = content.replace('–','–') content = content.replace('‹','‹') content = content.replace('›','›') content = content.replace('…','…') content = content.replace('&','&') return content
使用時直接調(diào)用Html2UBB函數(shù),返回值就是ubb碼了html轉(zhuǎn)ubb
相關(guān)文章
將Pytorch模型從CPU轉(zhuǎn)換成GPU的實現(xiàn)方法
今天小編就為大家分享一篇將Pytorch模型從CPU轉(zhuǎn)換成GPU的實現(xiàn)方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-08-08Python中requests、aiohttp、httpx性能比拼
本文主要介紹了Python中requests、aiohttp、httpx性能比拼,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2023-06-06