亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

基于python的docx模塊處理word和WPS的docx格式文件方式

 更新時(shí)間:2020年02月13日 11:29:05   作者:江戶川柯壯  
今天小編就為大家分享一篇基于python的docx模塊處理word和WPS的docx格式文件方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

Python docx module for Word or WPS processing

本文是通過(guò)docx把word中的表格中的某些已填好的內(nèi)容提取出來(lái),存入excel表格。

首先安裝docx的python模塊:

pip install python-docx

由于處理的為中文和符號(hào),改成utf-8編碼格式

import sys
reload(sys)
sys.setdefaultencoding('utf-8')
from docx import Document
import pandas as pd
# 打開(kāi)文件
doc = Document(ur'test_1.docx')

為了處理word中以對(duì)勾形式勾選的項(xiàng)目,采用下面 的方法

1、十字路口 √ 2、丁字路口 3、環(huán)形路口 4、人行立交

# 取出對(duì)號(hào)勾選的項(xiàng)目
print doc.tables[0].rows[3].cells[2].text
print doc.tables[0].rows[3].cells[2].text.split(u'√')[1].strip().split(' ')[0][2:]
'√' in doc.tables[0].rows[3].cells[2].text # 這個(gè)語(yǔ)句可以測(cè)試是否含有對(duì)勾,
# 有的話就取出對(duì)勾后面的item,否則直接返回填空的text

True

num_rows = len(doc.tables[0].rows)
print num_rows

xls = pd.read_csv(ur'output.csv')

print xls.columns[0]
diction = {}
# 找到每個(gè)excel文檔中需要被記錄的鍵值在docx文檔表格中的位置
for xlskey in xls.columns:
 for row_id in range(num_rows):
  row = doc.tables[0].rows[row_id]
  for cell_id in range(len(row.cells)):
   if row.cells[cell_id].text.strip() == xlskey.strip():
    diction[xlskey] = [row_id, cell_id]
# 查看一下獲得的鍵值位置
for key in list(diction.keys()):
 print key, diction[key]

樓層數(shù) [21, 1]

宗地形狀 [4, 1]

使用權(quán)取得時(shí)間 [14, 1]

采光通風(fēng)狀況 [19, 1]

已使用年限 [21, 4]

建筑朝向 [7, 1]

房屋結(jié)構(gòu) [17, 1]

交叉路口形式 [3, 1]

臨街狀況 [8, 1]

建筑容積率 [10, 5]

樓宇名稱 [15, 5]

質(zhì)量等級(jí) [18, 1]

周圍土地利用類型 [11, 1]

總建筑面積 [20, 1]

宗地位置 [0, 1]

所臨道路名稱 [2, 1]

裝修標(biāo)準(zhǔn) [16, 1]

那么我們認(rèn)為這些表頭鍵值對(duì)應(yīng)的填入數(shù)據(jù)就在他們的右邊,也就是下一個(gè)cell,因此我們只需要將row id不變,cell+1,就能取出填表內(nèi)容。

# 開(kāi)始填表!??!
for each_column in xls.columns:
 pos = diction[each_column]
 textion = doc.tables[0].rows[pos[0]].cells[pos[1] + 1].text
 if u'√' in textion:
  this_text = textion.strip(' ').split(u'√')[1].split()[0][2:]
 else:
  this_text = textion
 xls.loc[0, each_column] = this_text

xls

樓宇名稱 宗地位置 所臨道路名稱 交叉路口形式 宗地形狀 建筑朝向 臨街狀況 周圍土地利用類型 裝修標(biāo)準(zhǔn) 房屋結(jié)構(gòu) 質(zhì)量等級(jí) 采光通風(fēng)狀況 總建筑面積 樓層數(shù) 已使用年限 建筑容積率 使用權(quán)取得時(shí)間
0 百興花園 鄂州市鄂城區(qū)鳳凰路47-11號(hào) 鳳凰路 丁字路口 多邊形 離街 商業(yè)用地 豪華 1、鋼 2、鋼、鋼混 3、鋼混 4、混合 5、磚木 6、其它 完好 122.7平方米 8 13年

Succeed!!!

之后只需要用一個(gè)glob函數(shù)取出所有的文檔的path,然后依次執(zhí)行上面的命令,即可完成word表格到excel(實(shí)際上是csv形式)的自動(dòng)填表過(guò)程。

以上這篇基于python的docx模塊處理word和WPS的docx格式文件方式就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python使用requests模塊爬取百度翻譯

    Python使用requests模塊爬取百度翻譯

    這篇文章主要介紹了Python使用requests模塊爬取百度翻譯,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-08-08
  • 解決flask接口返回的內(nèi)容中文亂碼的問(wèn)題

    解決flask接口返回的內(nèi)容中文亂碼的問(wèn)題

    這篇文章主要介紹了解決flask接口返回的內(nèi)容中文亂碼的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-04-04
  • python基于twisted框架編寫(xiě)簡(jiǎn)單聊天室

    python基于twisted框架編寫(xiě)簡(jiǎn)單聊天室

    這篇文章主要為大家詳細(xì)介紹了python基于twisted框架編寫(xiě)簡(jiǎn)單聊天室,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-01-01
  • 使用Docker制作Python環(huán)境連接Oracle鏡像

    使用Docker制作Python環(huán)境連接Oracle鏡像

    這篇文章主要為大家介紹了使用Docker制作Python環(huán)境連接Oracle鏡像示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-06-06
  • 詳解Python中while無(wú)限迭代循環(huán)方法

    詳解Python中while無(wú)限迭代循環(huán)方法

    Python 有 while 語(yǔ)句和 for 語(yǔ)句作為循環(huán)處理。雖然 for 語(yǔ)句具有一定數(shù)量的進(jìn)程,但 while 語(yǔ)句是直到滿足條件類型的循環(huán)進(jìn)程。本文將詳解while無(wú)限迭代循環(huán)方法,需要的可以了解一下
    2022-04-04
  • python機(jī)器學(xué)習(xí)理論與實(shí)戰(zhàn)(二)決策樹(shù)

    python機(jī)器學(xué)習(xí)理論與實(shí)戰(zhàn)(二)決策樹(shù)

    這篇文章主要介紹了python機(jī)器學(xué)習(xí)理論與實(shí)戰(zhàn)第二篇,決策樹(shù)的相關(guān)資料,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-01-01
  • Python實(shí)現(xiàn)準(zhǔn)確獲取PDF文件中的標(biāo)題

    Python實(shí)現(xiàn)準(zhǔn)確獲取PDF文件中的標(biāo)題

    想要在PDF文件中,解析獲取全部的標(biāo)題,是一件比較麻煩的事情,這篇文章將介紹一種較為準(zhǔn)確的提取標(biāo)題的方式,感興趣的小伙伴可以了解一下
    2024-02-02
  • 使用Python實(shí)現(xiàn)MapReduce的示例代碼

    使用Python實(shí)現(xiàn)MapReduce的示例代碼

    MapReduce是一個(gè)用于大規(guī)模數(shù)據(jù)處理的分布式計(jì)算模型,最初由Google工程師設(shè)計(jì)并實(shí)現(xiàn)的,Google已經(jīng)將完整的MapReduce論文公開(kāi)發(fā)布了,本文給大家介紹了使用Python實(shí)現(xiàn)MapReduce的示例代碼,需要的朋友可以參考下
    2024-05-05
  • Python模塊的制作方法實(shí)例分析

    Python模塊的制作方法實(shí)例分析

    這篇文章主要介紹了Python模塊的制作方法,結(jié)合實(shí)例形式分析了Python第三方模塊的編寫(xiě)、調(diào)用相關(guān)操作技巧與使用注意事項(xiàng),需要的朋友可以參考下
    2019-12-12
  • Python中基本的日期時(shí)間處理的學(xué)習(xí)教程

    Python中基本的日期時(shí)間處理的學(xué)習(xí)教程

    這篇文章主要介紹了Python中基本的日期時(shí)間處理的學(xué)習(xí)教程,日期時(shí)間相關(guān)模塊的使用是Python入門(mén)學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下
    2015-10-10

最新評(píng)論