亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python讀取word文本操作詳解

 更新時間:2018年01月22日 13:39:56   作者:熊貓大哥大  
這篇文章主要介紹了Python讀取word文本操作詳解,介紹了涉及到的模塊,相關概念,模塊的安裝等內容,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下

本文研究的主要問題時Python讀取word文本操作,分享了相關概念和實現代碼,具體如下。

一,docx模塊

Python可以利用python-docx模塊處理word文檔,處理方式是面向對象的。也就是說python-docx模塊會把word文檔,文檔中的段落、文本、字體等都看做對象,對對象進行處理就是對word文檔的內容處理。

二,相關概念

如果需要讀取word文檔中的文字(一般來說,程序也只需要認識word文檔中的文字信息),需要先了解python-docx模塊的幾個概念。

1,Document對象,表示一個word文檔。
2,Paragraph對象,表示word文檔中的一個段落
3,Paragraph對象的text屬性,表示段落中的文本內容。

三,模塊的安裝和導入

需要注意,python-docx模塊安裝需要在cmd命令行中輸入pip install python-docx,如下圖表示安裝成功(最后那句英文Successfully installed,成功地安裝完成,十分考驗英文水平。)

注意在導入模塊時,用的是import docx。

也真是奇了怪了,怎么安裝和導入模塊時,很多都不用一個名字,看來是很有必要出一個python版本的模塊管理程序python-maven了,本段純屬PS。

四,讀取word文本

在了解了上面的信息之后,就很簡單了,下面先創(chuàng)建一個D:\temp\word.docx文件,并在其中輸入如下內容。

然后寫一段程序,代碼及輸出結果如下:

#讀取docx中的文本代碼示例
import docx
#獲取文檔對象
file=docx.Document("D:\\temp\\word.docx")
print("段落數:"+str(len(file.paragraphs)))#段落數為13,每個回車隔離一段

#輸出每一段的內容
for para in file.paragraphs:
 print(para.text)

#輸出段落編號及段落內容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的內容是:"+file.paragraphs[i].text)

運行結果:

================ RESTART: F:/360data/重要數據/桌面/學習筆記/readWord.py ================
段落數:13
啊

我看見一座山

雄偉的大山

真高啊

啊

這座山是!

真的很高!
第0段的內容是:啊
第1段的內容是:
第2段的內容是:我看見一座山
第3段的內容是:
第4段的內容是:雄偉的大山
第5段的內容是:
第6段的內容是:真高啊
第7段的內容是:
第8段的內容是:啊
第9段的內容是:
第10段的內容是:這座山是!
第11段的內容是:
第12段的內容是:真的很高!
>>> 

總結

以上就是本文關于Python讀取word文本操作詳解的全部內容,希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站其他相關專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!

相關文章

  • Python3調用百度AI識別圖片中的文字功能示例【測試可用】

    Python3調用百度AI識別圖片中的文字功能示例【測試可用】

    這篇文章主要介紹了Python3調用百度AI識別圖片中的文字功能,結合實例形式分析了Python3安裝及使用百度AI接口的相關操作技巧,并附帶說明了百度官方AI平臺的注冊及接口調用操作方法,需要的朋友可以參考下
    2019-03-03
  • python實踐項目之監(jiān)控當前聯(lián)網狀態(tài)詳情

    python實踐項目之監(jiān)控當前聯(lián)網狀態(tài)詳情

    介紹一個利用Python監(jiān)控當前聯(lián)網狀態(tài)情況的python代碼,它可以清楚地知道,你的電腦網絡是否是鏈接成功或失敗,下面小編帶大家來一起學習它
    2019-05-05
  • django從后臺返回html代碼的實例

    django從后臺返回html代碼的實例

    這篇文章主要介紹了django從后臺返回html代碼的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03
  • Django使用中間件解決前后端同源策略問題

    Django使用中間件解決前后端同源策略問題

    這篇文章主要介紹了Django使用中間件解決前后端同源策略問題,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-09-09
  • Python使用Pickle庫實現讀寫序列操作示例

    Python使用Pickle庫實現讀寫序列操作示例

    這篇文章主要介紹了Python使用Pickle庫實現讀寫序列操作,結合實例形式分析了pickle模塊的功能、常用函數以及序列化與反序列化相關操作技巧,需要的朋友可以參考下
    2018-06-06
  • Python+Selenium實現瀏覽器標簽頁的切換

    Python+Selenium實現瀏覽器標簽頁的切換

    在實際工作中,我們經常會遇到頁面切換的情況。就比如當點擊了某個功能的按鈕后,瀏覽器出現了新的標簽頁,需要在這些標簽頁之間進行切換。本文將利用Selenium實現這一功能,需要的可以參考一下
    2022-06-06
  • conda下載各種包時如何避免版本不匹配問題

    conda下載各種包時如何避免版本不匹配問題

    在使用python和conda時,由于Python版本不匹配,可能會導致一些問題的出現,本文主要介紹了conda下載各種包時如何避免版本不匹配問題,感興趣的可以了解一下
    2024-03-03
  • caffe的python接口之手寫數字識別mnist實例

    caffe的python接口之手寫數字識別mnist實例

    這篇文章主要為大家介紹了caffe的python接口之手寫數字識別mnist實例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-06-06
  • Python+MediaPipe實現檢測人臉功能詳解

    Python+MediaPipe實現檢測人臉功能詳解

    MediaPipe是用于構建多模態(tài)(例如視頻、音頻或任何時間序列數據)、跨平臺(即eAndroid、IOS、web、邊緣設備)應用ML管道的框架。本文將利用MediaPipe實現檢測人臉功能,需要的可以參考一下
    2022-02-02
  • Python中的int函數使用

    Python中的int函數使用

    這篇文章主要介紹了Python中的int函數使用方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-11-11

最新評論