python處理“”開(kāi)頭加數(shù)字的html字符方法
python如何處理“&#”開(kāi)頭加數(shù)字的html字符,比如:风水這類(lèi)數(shù)據(jù)。
用python抓取數(shù)據(jù)時(shí),有時(shí)會(huì)遇到想要數(shù)據(jù)是以“&#”開(kāi)頭加數(shù)字的字符,比如圖中所示的這些:
风水大术士
這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。
Python2.7版本
在python2.7版本中,使用import HTMLParser
定義變量,再定義轉(zhuǎn)換代碼。
代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過(guò)此才能用“.unescape()”方法。
測(cè)試運(yùn)行,這串字符串正常輸出了中文。
Python3.7+版本
在最新python版本中,不能用上面的導(dǎo)入方法??梢杂?import html"或者“from html import unescape”。這里使用"import html"做測(cè)試。
導(dǎo)入html后,直接用".unescape()"來(lái)處理字符串。
運(yùn)行后,正常轉(zhuǎn)換成了中文字符。
感謝大家的閱讀和對(duì)腳本之家的支持。
相關(guān)文章
python xlwt如何設(shè)置單元格的自定義背景顏色
這篇文章主要介紹了python xlwt如何設(shè)置單元格的自定義背景顏色,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-09-09使用pycharm連接讀取orcl數(shù)據(jù)庫(kù)的表的操作方法
這篇文章主要介紹了使用pycharm連接讀取orcl數(shù)據(jù)庫(kù)的表的操作方法,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧2024-01-01Python??reduce()函數(shù)的用法示例代碼
reduce函數(shù)原本在python2中也是個(gè)內(nèi)置函數(shù),不過(guò)在python3中被移到functools模塊中,這篇文章主要介紹了Python reduce()函數(shù)的用法,需要的朋友可以參考下2023-05-05表格梳理python內(nèi)置數(shù)學(xué)模塊math分析詳解
這篇文章主要為大家介紹了python內(nèi)置數(shù)學(xué)模塊math的分析詳解,文中通過(guò)表格梳理的方式以便讓大家在學(xué)習(xí)過(guò)程中一目望去清晰明了,有需要的朋友可以借鑒參考下2021-10-10Python實(shí)現(xiàn)UDP與TCP通信的示例詳解
UDP是一種無(wú)連接的、不可靠的傳輸協(xié)議;TCP是一種可靠的、面向連接的傳輸協(xié)議。這篇文章主要介紹了Python實(shí)現(xiàn)UDP與TCP通信的方法,需要的可以參考一下2023-03-03Python機(jī)器學(xué)習(xí)實(shí)戰(zhàn)之k-近鄰算法的實(shí)現(xiàn)
k-近鄰算法采用測(cè)量不同特征值之間的距離方法進(jìn)行分類(lèi)。這篇文章主要為大家介紹了如何通過(guò)python實(shí)現(xiàn)K近鄰算法,有需要的朋友可以借鑒參考下,希望能夠有所幫助2021-11-11使用Python搭建服務(wù)器公網(wǎng)展示本地電腦文件的操作過(guò)程
這篇文章主要介紹了使用Python搭建服務(wù)器公網(wǎng)展示本地電腦文件,今天我們就嘗試用python,建立一個(gè)簡(jiǎn)單的http服務(wù)器,用來(lái)展示本地電腦上指定的目錄和文件,需要的朋友可以參考下2023-08-08Python實(shí)現(xiàn)讀寫(xiě)INI配置文件的方法示例
這篇文章主要介紹了Python實(shí)現(xiàn)讀寫(xiě)INI配置文件的方法,結(jié)合實(shí)例形式分析了Python針對(duì)ini配置文件的讀寫(xiě)操作類(lèi)定義及使用方法,需要的朋友可以參考下2018-06-06