亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

解決python將xml格式文件轉(zhuǎn)換成txt文件的問題(xml.etree方法)

 更新時(shí)間:2021年09月19日 11:02:19   作者:小k同學(xué)!  
從數(shù)據(jù)分析的角度去看xml格式的數(shù)據(jù)集,具有簡單性,結(jié)構(gòu)和內(nèi)容分離、可擴(kuò)展性的特征,今天通過本文給大家分享python將xml格式文件轉(zhuǎn)換成txt文件的問題及解決方法(xml.etree方法),感興趣的朋友一起看看吧

概述

先來介紹一下xml格式的文件,從數(shù)據(jù)分析的角度去看xml格式的數(shù)據(jù)集,具有以下的優(yōu)點(diǎn)開放性(能在任何平臺(tái)上讀取和處理數(shù)據(jù),允許通過一些網(wǎng)絡(luò)協(xié)議交換xml數(shù)據(jù))、簡單性(純文本,能在不同的系統(tǒng)之間交換數(shù)據(jù))、結(jié)構(gòu)和內(nèi)容分離(不同于HTML,數(shù)據(jù)的顯示和數(shù)據(jù)本身是分開的)、可擴(kuò)展性(派生出其他標(biāo)記語言)

問題描述

那么我們?cè)谶M(jìn)行數(shù)據(jù)分析的時(shí)候,如何運(yùn)用xml里面的數(shù)據(jù)呢?
我們就需要將這類文件轉(zhuǎn)化成其他類型的文件。
(其實(shí)我認(rèn)為說成提取xml的數(shù)據(jù)組成新的類型文件比較好一點(diǎn))
就我個(gè)人的觀點(diǎn),處理這方面的問題有點(diǎn)類似于網(wǎng)絡(luò)爬蟲,但不同于爬蟲的是不需要考慮IP代理地址的問題(反爬確實(shí)是一個(gè)很難處理的問題)

問題解決方案

xml格式文件顯示內(nèi)容大致如下:

在這里插入圖片描述

import os
import sys
import xml.etree.ElementTree as ET
import glob

def xml_to_txt(indir, outdir):
    os.chdir(indir) # indir為xml文件來源的文件夾,outdir為轉(zhuǎn)換的txt文件存儲(chǔ)路徑
    annotated = os.listdir('.') # 返回包含目錄中文件名稱的列表
    print(annotated)
    
    for i, file in enumerate(annotated):
        file_save = file.split('.')[0] + '.txt' #split將文件名與后綴名劃分開來
        file_txt = outdir + "\\"+file_save
        f_w = open(file_txt, 'w')
        
        in_file = open(file,encoding='UTF-8')
        tree = ET.parse(in_file)
        root = tree.getroot()
        # 以下代碼可忽略,你要在xml數(shù)據(jù)集上找到自己所需要數(shù)據(jù)對(duì)應(yīng)的標(biāo)簽,想辦法將其賦予一個(gè)變量,再將其寫入新文件里就ok了
        for value in root.iter('xxx'):
            value = value.text
            f_w.write(value)
            f_w.write('\n\n')

還有我要說幾句這個(gè)方法還是挺好用的,在你處理一個(gè)包含很多.xml文件夾的時(shí)候,能夠直接讀取所有xml文件,這樣處理起來也比較方便。

到此這篇關(guān)于python將xml格式文件轉(zhuǎn)換成txt文件的問題及解決方法(xml.etree方法)的文章就介紹到這了,更多相關(guān)python xml轉(zhuǎn)換成txt文件內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • tensorflow如何批量讀取圖片

    tensorflow如何批量讀取圖片

    這篇文章主要為大家詳細(xì)介紹了tensorflow如何批量讀取圖片,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-08-08
  • Python3交互式shell ipython3安裝及使用詳解

    Python3交互式shell ipython3安裝及使用詳解

    這篇文章主要介紹了Python3交互式shell ipython3安裝及使用詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-07-07
  • 如何安裝2019Pycharm最新版本(詳細(xì)教程)

    如何安裝2019Pycharm最新版本(詳細(xì)教程)

    這篇文章主要介紹了如何安裝2019Pycharm最新版本(詳細(xì)教程),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-09-09
  • 利用Pycharm + Django搭建一個(gè)簡單Python Web項(xiàng)目的步驟

    利用Pycharm + Django搭建一個(gè)簡單Python Web項(xiàng)目的步驟

    這篇文章主要介紹了利用Pycharm + Django搭建一個(gè)簡單Python Web項(xiàng)目的步驟,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-10-10
  • Python?文本文件與csv文件的讀取與寫入

    Python?文本文件與csv文件的讀取與寫入

    這篇文章主要介紹了Python文本文件與csv文件的讀取與寫入,有讀取文件的?read()方法、讀取文件的readline()?方法、讀取文件的?readlines()方法等相關(guān)讀寫內(nèi)容,需要的小伙伴可以參考一下
    2022-03-03
  • 使用python如何實(shí)現(xiàn)泛型函數(shù)

    使用python如何實(shí)現(xiàn)泛型函數(shù)

    這篇文章主要介紹了使用python如何實(shí)現(xiàn)泛型函數(shù),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-09-09
  • Python使用Pandas讀寫Excel實(shí)例解析

    Python使用Pandas讀寫Excel實(shí)例解析

    這篇文章主要介紹了Python使用Pandas讀寫Excel實(shí)例解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-11-11
  • Python 3中print函數(shù)的使用方法總結(jié)

    Python 3中print函數(shù)的使用方法總結(jié)

    這篇文章主要給大家總結(jié)介紹了關(guān)于Python 3中print函數(shù)的使用方法,python3中的print函數(shù)和之前版本的用法相差很多,本文通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起看看吧。
    2017-08-08
  • 淺談Python批處理文件夾中的txt文件

    淺談Python批處理文件夾中的txt文件

    這篇文章主要介紹了Python批處理文件夾中的txt文件,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-03-03
  • python獲取word文檔總頁數(shù)的兩種方法

    python獲取word文檔總頁數(shù)的兩種方法

    這篇文章主要介紹了python獲取word文檔的總頁數(shù)的兩種方法,文中給出了兩種解決方案,兩種方案也都各有優(yōu)缺點(diǎn),可能也不一定是完全準(zhǔn)確的,需要的朋友可以參考下
    2024-03-03

最新評(píng)論