如何使用Python的xml.etree.ElementTree模塊解析和操作 XML 數(shù)據(jù)
Date: 2025.01.04 17:30:45 author: lijianzhan
簡(jiǎn)述:xml.etree.ElementTree 是 Python 標(biāo)準(zhǔn)庫(kù)的一部分,而且是 Python 標(biāo)準(zhǔn)庫(kù)中用于解析和操作 XML 數(shù)據(jù)的模塊,因此不需要通過(guò) pip install 安裝。只要你安裝了 Python(無(wú)論是 Python 2.x 還是 Python 3.x),就可以直接使用xml.etree.ElementTree 。它提供了一種簡(jiǎn)單而高效的方式來(lái)處理 XML 文件,支持解析、創(chuàng)建、修改和查詢 XML 數(shù)據(jù)。
引入xml.etree.ElementTree模塊
import xml.etree.ElementTree as ET print(ET.__version__) # 打印版本信息
xml.etree.ElementTree 的詳細(xì)介紹,ElementTree 基本概念: Element:表示 XML 中的一個(gè)節(jié)點(diǎn),包含標(biāo)簽(tag),屬性(attrib)和子節(jié)點(diǎn)(children),ElementTree:表示整個(gè) XML 文檔的樹結(jié)構(gòu)。
知道基本概念后,可以使用內(nèi)部方法解析XML。代碼示例如下:
#解析 XML
1.從文件解析
import xml.etree.ElementTree as ET # 解析 XML 文件 tree = ET.parse('data.xml') root = tree.getroot() # 獲取根元素
2.從字符串解析
xml_data = ''' <root> <child id="1">Text1</child> <child id="2">Text2</child> </root> ''' root = ET.fromstring(xml_data) # 從字符串解析
3獲取XML格式數(shù)據(jù)并遍歷節(jié)點(diǎn)代碼如下:
xml_content = res.text # 獲取響應(yīng)數(shù)據(jù) root = ET.fromstring(xml_content)# 解析 XML # 遍歷所有的 game 元素 for game in root.findall('game'):
4.完整的從請(qǐng)求http接口,獲取XML數(shù)據(jù)并解析得到數(shù)據(jù)的腳步實(shí)例,代碼如下:
import time import requests from time import sleep import xml.etree.ElementTree as ET class GetM061Com: def getLogin(self, username, password): print("登錄模塊") url = 'http://www.baidu.com?mode=login' headers = { 'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 16_6 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/16.6 Mobile/15E148 Safari/604.1' } data = { 'mode': 'login', 'username': username, 'password': password, } res = requests.post(url, headers=headers, data=data) if res.status_code == 200: xml_content = res.text # 獲取響應(yīng)數(shù)據(jù) root = ET.fromstring(xml_content) # 解析XML數(shù)據(jù) return root.find('uid').text def getIndex(self, uid): print("首頁(yè)模塊") if not uid: print("未獲取到有效的 uid") return # 獲取當(dāng)前的秒級(jí)時(shí)間戳 current_time_s = time.time() # 將秒級(jí)時(shí)間戳轉(zhuǎn)換為毫秒級(jí)時(shí)間戳 current_time_ms = int(current_time_s * 1000) sleep(3) url = 'http://www.baidu.com?mode=index' headers = { 'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 16_6 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/16.6 Mobile/15E148 Safari/604.1' } data = { 'uid': uid, 'mode': 'home', 'ts': current_time_ms } res = requests.post(url, headers=headers, data=data) if res.status_code == 200: xml_content = res.text # 獲取響應(yīng)數(shù)據(jù) root = ET.fromstring(xml_content)# 解析 XML # 遍歷所有的 game 元素 for game in root.findall('game'): game_id = game.get('id') gtype = game.find('gtype').text if gtype == 'football': print("-足球") print("game_id:" + game_id) elif gtype == 'basketball': print("-籃球") print("game_id:" + game_id) if __name__ == '__main__': username = ''# 賬號(hào) password = ''# 密碼 uid = GetM061Com().getLogin(username, password) GetM061Com().getIndex(uid)
5.總結(jié)
xml.etree.ElementTree 是處理 XML 數(shù)據(jù)的強(qiáng)大工具,適合解析、修改和生成 XML 文件。它的接口簡(jiǎn)單易用,能夠滿足大多數(shù) XML 處理需求。如果你有更復(fù)雜的需求(如命名空間處理),可以考慮使用 lxml 庫(kù),它提供了更強(qiáng)大的功能和更好的性能。
到此這篇關(guān)于使用Python的xml.etree.ElementTree模塊解析和操作 XML 數(shù)據(jù)的文章就介紹到這了,更多相關(guān)Python xml.etree.ElementTree解析xml內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python數(shù)據(jù)結(jié)構(gòu)隊(duì)列解決約瑟夫斯問(wèn)題
這篇文章主要介紹了Python數(shù)據(jù)結(jié)構(gòu)隊(duì)列解決約瑟夫斯問(wèn)題2023-02-02利用pandas進(jìn)行數(shù)據(jù)清洗的方法
本文主要介紹了利用pandas進(jìn)行數(shù)據(jù)清洗的方法,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-09-09Python如何實(shí)現(xiàn)自動(dòng)發(fā)送郵件
對(duì)于一些每天需要發(fā)的報(bào)表或者是需要一次發(fā)送多份的報(bào)表,我們可以考慮借助Python來(lái)自動(dòng)發(fā)送郵件。本文主要介紹了如何利用Python實(shí)現(xiàn)自動(dòng)發(fā)送郵件,感興趣的小伙伴可以了解一下2021-11-11Python實(shí)現(xiàn)GUI圖片瀏覽的小程序
這篇文章主要介紹了Python實(shí)現(xiàn)GUI圖片瀏覽程序,程序的實(shí)現(xiàn)需要pillow庫(kù),pillow是 Python 的第三方圖像處理庫(kù),需要安裝才能實(shí)用,文中通過(guò)代碼示例給大家介紹的非常詳細(xì),需要的朋友可以參考下2023-12-12