Python進(jìn)行word模板內(nèi)容替換的實(shí)現(xiàn)示例
技術(shù)背景與需求場(chǎng)景
- Word模板在辦公自動(dòng)化中的重要性
- Python處理Word文檔的常見需求(批量生成報(bào)告、合同等)
- 傳統(tǒng)手動(dòng)替換的局限性及自動(dòng)化解決方案的優(yōu)勢(shì)
核心工具庫介紹
python-docx:基礎(chǔ)讀寫操作,但默認(rèn)不支持模板變量替換docxtpl:基于python-docx的擴(kuò)展,支持Jinja2模板語法mailmerge:適用于簡單郵件合并場(chǎng)景- 其他可選庫(如
docx-mailmerge)的簡要對(duì)比
這里作者平常主要使用的是python-docx的方式,這里給大家提供一些常用word模板內(nèi)容替換的方法及可能用到的函數(shù)
1.獲取你的word模板內(nèi)容
簡單粗暴的方式,可以直接幫你看到你的模板每一個(gè)內(nèi)容的數(shù)據(jù)及占位點(diǎn)(索引),其中當(dāng)數(shù)據(jù)為字符串的內(nèi)容,大多是直接展示,而當(dāng)你看到某一個(gè)數(shù)據(jù)的為 " "字符串時(shí),此時(shí)注意觀察你模板中的上下文,該位置可能表示了你模板中的表格或者圖形的占位(先記住,后面會(huì)用到?。。?/p>
def run():
text0 = doc.paragraphs[0].text
text1 = doc.paragraphs[1].text
text2 = doc.paragraphs[2].text
...
if __name__ == '__main__':
run()2.正常文本內(nèi)容的替換
當(dāng)我們發(fā)現(xiàn)我們需要替換一段文字的時(shí)候,首先找到該段文字表示的位置,假如
text0 = doc.paragraphs[0].text 此時(shí)是一段文字
# 省略導(dǎo)包,根據(jù)代碼缺失的去安裝
new_file_path = 'xxx' # 文件路徑
doc = Document(new_file_path)
paragraphs_1_text = '這是我要替換的文字'
# 通用替換文本方式
def replace_paragraph_text(paragraph, new_text):
"""可以在該方法下新增對(duì)特定段落的額外處理"""
# 遍歷段落中的所有 runs
for run in paragraph.runs:
run.text = "" # 清空每個(gè) run 的文本
# 將新文本插入到第一個(gè) run 中,保留樣式
paragraph.runs[0].text = new_text
if __name__ == '__main__':
text0 = "這是原來的文字" # 假設(shè)你的text0是這段文字
replace_paragraph_text(doc.paragraphs[0], paragraphs_1_text) # doc.paragraphs[0]為你段落的位置, paragraphs_1_text則是要替換的文本。
""" 使用該方式即可替換所有文字的段落 """
3.表格內(nèi)容的替換
當(dāng)發(fā)現(xiàn)我上面說的那種數(shù)據(jù)為空字符串的時(shí)候,而且你在模板中發(fā)現(xiàn)其為表格,就可以使用我下面的方式進(jìn)行替換,一般表格的替換比較特殊,tables0 = doc.tables[xxx]來寫表格的索引,可以不用去看段落的索引,而是根據(jù)你模板中的表格的數(shù)量索引來看,第一個(gè)表格索引就是0,以此類推。
tables0 = doc.tables[xxx] # 寫你表格索引
def set_font_table(para, font_name="仿宋", font_size=12, char_spacing=None, bold=True):
"""
設(shè)置段落的字體為指定字體和大小,并可設(shè)置字間距,同時(shí)支持加粗
"""
for run in para.runs:
run.font.name = font_name
run.font.size = Pt(font_size)
run.font.bold = bold # 設(shè)置加粗
if char_spacing:
run.font.spacing = char_spacing
"""
可選部分,看是否刪除表的數(shù)據(jù)
"""
#for row_index in range(len(tables0.rows)-1, 0, -1): # 從最后一行開始刪除到第二行
# if row_index > 0: # 確保不刪除表頭行(假設(shè)表頭是第一行)
# tables0._element.remove(tables8.rows[row_index]._element)
# 根據(jù) table_data 重新添加行和填充數(shù)據(jù)
#for row_index, row_data in enumerate(table_data, start=1): # 從第二行開始
# # row = tables0.add_row() # 添加新的一行(根據(jù)上面是否刪除表選擇解注)
# for col_index in range(min(column_count, len(row_data))): # 保證不會(huì)超出列數(shù)范圍
# cell = row.cells[col_index]
# cell.text = str(row_data[col_index])
# for para in cell.paragraphs:
# set_font_table(para, font_name="仿宋", font_size=12, bold=False)
# para.alignment = WD_ALIGN_PARAGRAPH.CENTER
# 常用部分
new_table_data = [[]] # 通常是這個(gè)格式,里面的每個(gè)[]存每一行表格數(shù)據(jù)
for row_index, row_data in enumerate(new_table_data, start=1): # 從第二行開始
for col_index, cell_data in enumerate(row_data, start=0): # 從第一列開始
# 獲取每個(gè)單元格
cell = tables0.cell(row_index, col_index)
cell.text = str(cell_data)
for para in cell.paragraphs:
set_font_table(para, font_name="仿宋", font_size=12, bold=False)
para.alignment = WD_ALIGN_PARAGRAPH.CENTER一般通過上述方式可完成替換表格內(nèi)容
4.圖形內(nèi)容的替換
首先需要用python的plt 方法進(jìn)行生成圖型(柱狀圖、折線圖等),生成圖形這部分代碼省略,這里主要講下如何進(jìn)行段落替換,直接上代碼:
chart_image_path = generate_bar_chart(數(shù)據(jù)內(nèi)容, 地址) # 通過一個(gè)方法獲取生成的柱狀圖地址
target_paragraph = doc.paragraphs[xxx] # 通過你的上下文段落來判斷這里是否是一個(gè)圖形,找出其對(duì)應(yīng)的索引
old_inline = None
for element in target_paragraph._element.findall('.//wp:inline', namespaces={'wp': 'http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing'}):
# for element in target_paragraph._element.iter():
if element.tag.endswith("inline"): # 檢查是否是 <wp:inline> 元素
old_inline = element
break
from docx.shared import Inches
# 如果找到舊的 <wp:inline> 對(duì)象
if old_inline is not None:
# 插入新圖片并獲取其 <wp:inline> 對(duì)象
new_run = target_paragraph.add_run()
new_inline = new_run.add_picture(chart_image_path, width=Inches(5.5))._inline
# 替換舊的 <wp:inline> 對(duì)象
parent = old_inline.getparent()
parent.replace(old_inline, new_inline)
# 刪除新插入的 run(因?yàn)槲覀円呀?jīng)替換了舊的 <wp:inline>)
target_paragraph._p.remove(new_run._element)通常處理這樣的word模板,是為了從某一數(shù)據(jù)源中,固定時(shí)間的獲取某些數(shù)據(jù)來替換模板生成我們想要的報(bào)告文檔之類的東西,為了實(shí)現(xiàn)自動(dòng)化,該替換代碼,通常在完成后,會(huì)與定時(shí)任務(wù)相關(guān)的東西相結(jié)合來使用。作者這里常用的是crontab來進(jìn)行定時(shí)任務(wù),大家可以借鑒或者是采取自己適合的方式進(jìn)行處理。
到此這篇關(guān)于Python進(jìn)行word模板內(nèi)容替換的實(shí)現(xiàn)示例的文章就介紹到這了,更多相關(guān)Python word模板內(nèi)容替換內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python基于pip實(shí)現(xiàn)離線打包過程詳解
這篇文章主要介紹了Python基于pip實(shí)現(xiàn)離線打包過程詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-05-05
python里讀寫excel等數(shù)據(jù)文件的6種常用方式(小結(jié))
這篇文章主要介紹了python里讀寫excel等數(shù)據(jù)文件的6種常用方式(小結(jié)),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04
詳解python列表(list)的使用技巧及高級(jí)操作
這篇文章主要介紹了詳解python列表(list)的使用技巧及高級(jí)操作,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08
pycharm與jupyter?lab/notebook結(jié)合使用方式
這篇文章主要介紹了pycharm與jupyter?lab/notebook結(jié)合使用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-06-06

