亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python處理“&#”開(kāi)頭加數(shù)字的html字符方法

 更新時(shí)間:2019年06月10日 16:47:10   投稿:laozhang  
在本篇文章里小編給大家整理了關(guān)于python如何處理“&#”開(kāi)頭加數(shù)字的html字符的相關(guān)知識(shí)點(diǎn)總結(jié),有興趣的朋友們學(xué)習(xí)下。

python如何處理“&#”開(kāi)頭加數(shù)字的html字符,比如:风水這類(lèi)數(shù)據(jù)。

用python抓取數(shù)據(jù)時(shí),有時(shí)會(huì)遇到想要數(shù)據(jù)是以“&#”開(kāi)頭加數(shù)字的字符,比如圖中所示的這些:

风水大术士

這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

定義變量,再定義轉(zhuǎn)換代碼。

代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過(guò)此才能用“.unescape()”方法。 

測(cè)試運(yùn)行,這串字符串正常輸出了中文。

Python3.7+版本

在最新python版本中,不能用上面的導(dǎo)入方法??梢杂?import html"或者“from html import unescape”。這里使用"import html"做測(cè)試。

導(dǎo)入html后,直接用".unescape()"來(lái)處理字符串。

運(yùn)行后,正常轉(zhuǎn)換成了中文字符。

感謝大家的閱讀和對(duì)腳本之家的支持。

相關(guān)文章

最新評(píng)論