Python批量實現(xiàn)Word/EXCEL/PPT轉(zhuǎn)PDF
一、緒論背景
在日常辦公和文檔處理中,有時我們需要將多個Word文檔、Excel表格或PPT演示文稿轉(zhuǎn)換為PDF文件。將文檔轉(zhuǎn)換為PDF格式的好處是它可以保留文檔的布局和格式,并且可以在不同平臺上進行方便的查看和共享。
本篇博文將介紹如何使用Python編程語言批量實現(xiàn)將多個Word、Excel和PPT文件轉(zhuǎn)換為PDF文件。我們將通過使用Python第三方庫來讀取、編輯和保存這些文檔,并使用合適的轉(zhuǎn)換工具將它們轉(zhuǎn)換為PDF格式。
具體實現(xiàn)方面,我們將首先安裝所需的Python庫和相關(guān)軟件,主要使用三個庫函數(shù):os, win32com.client, gc。
1)os : os
是Python內(nèi)置的一個與操作系統(tǒng)交互的庫。它提供了許多用于處理文件和目錄的函數(shù),例如創(chuàng)建、刪除、重命名文件或目錄,獲取文件屬性,遍歷目錄等。通過使用 os
庫,我們可以在Python程序中執(zhí)行各種與操作系統(tǒng)相關(guān)的任務(wù)。
2)win32com.client : win32com.client
是一個用于與Windows平臺上的COM組件進行交互的Python庫。COM(Component Object Model)是一種面向?qū)ο蟮慕M件技術(shù),允許不同的應(yīng)用程序之間進行通信和交互。 win32com.client
庫提供了一種方便的方式來調(diào)用和操作COM組件,如Microsoft Office應(yīng)用程序(Word、Excel、PowerPoint等)。通過這個庫,我們可以自動化執(zhí)行一些Office任務(wù),如讀寫文檔、操作Excel表格、創(chuàng)建PPT演示文稿等。
3)gc : gc
是Python內(nèi)置的垃圾回收模塊。垃圾回收是指在程序執(zhí)行過程中,自動檢測和回收不再使用的內(nèi)存空間,以提高內(nèi)存利用率和程序性能。 gc
模塊為我們提供了一些功能,如手動觸發(fā)垃圾回收、獲取和設(shè)置垃圾回收的閾值等。盡管Python有自動的垃圾回收機制,但在某些情況下,我們可能需要手動控制垃圾回收的行為。
然后,我們將編寫Python代碼來遍歷指定文件夾中的所有文檔,并對每個文檔進行逐個轉(zhuǎn)換。
最后,我們將保存轉(zhuǎn)換后的PDF文件到指定的目錄中。
通過閱讀本篇博文,你將學(xué)習(xí)到如何使用Python編程語言批量實現(xiàn)將多個Word、Excel和PPT文件轉(zhuǎn)換為PDF文件的方法。這將為你提供一種自動化的方式來處理文檔轉(zhuǎn)換任務(wù),節(jié)省時間和精力,并提高工作效率。
無論你是一位辦公人員、學(xué)生還是有大量文檔需要處理的個人用戶,本篇教程都將幫助你掌握如何使用Python批量實現(xiàn)Word、Excel和PPT轉(zhuǎn)換為PDF文件。讓我們一起開始這個方便實用的文檔處理之旅吧!
二、代碼實踐
大家運行本代碼,只需要更改為自己的路徑即可。如代碼中我的地址:D:\Pycharmproject2023\code_test_project\shan_test\data,改為你本地地址即可。
import os, win32com.client, gc # Word def word2Pdf(filePath, words): # 如果沒有文件則提示后直接退出 if (len(words) < 1): print("\n【無 Word 文件】\n") return # 開始轉(zhuǎn)換 print("\n【開始 Word -> PDF 轉(zhuǎn)換】") try: print("打開 Word 進程...") word = win32com.client.Dispatch("Word.Application") word.Visible = 0 word.DisplayAlerts = False doc = None for i in range(len(words)): print(i) fileName = words[i] # 文件名稱 fromFile = os.path.join(filePath, fileName) # 文件地址 toFileName = changeSufix2Pdf(fileName) # 生成的文件名稱 toFile = toFileJoin(filePath, toFileName) # 生成的文件地址 print("轉(zhuǎn)換:" + fileName + "文件中...") # 某文件出錯不影響其他文件打印 try: doc = word.Documents.Open(fromFile) doc.SaveAs(toFile, 17) # 生成的所有 PDF 都會在 PDF 文件夾中 print("轉(zhuǎn)換到:" + toFileName + "完成") except Exception as e: print(e) # 關(guān)閉 Word 進程 print("所有 Word 文件已打印完畢") print("結(jié)束 Word 進程...\n") doc.Close() doc = None word.Quit() word = None except Exception as e: print(e) finally: gc.collect() # Excel def excel2Pdf(filePath, excels): # 如果沒有文件則提示后直接退出 if (len(excels) < 1): print("\n【無 Excel 文件】\n") return # 開始轉(zhuǎn)換 print("\n【開始 Excel -> PDF 轉(zhuǎn)換】") try: print("打開 Excel 進程中...") excel = win32com.client.Dispatch("Excel.Application") excel.Visible = 0 excel.DisplayAlerts = False wb = None ws = None for i in range(len(excels)): print(i) fileName = excels[i] # 文件名稱 fromFile = os.path.join(filePath, fileName) # 文件地址 print("轉(zhuǎn)換:" + fileName + "文件中...") # 某文件出錯不影響其他文件打印 try: wb = excel.Workbooks.Open(fromFile) for j in range(wb.Worksheets.Count): # 工作表數(shù)量,一個工作簿可能有多張工作表 toFileName = addWorksheetsOrder(fileName, j + 1) # 生成的文件名稱 toFile = toFileJoin(filePath, toFileName) # 生成的文件地址 ws = wb.Worksheets(j + 1) # 若為[0]則打包后會提示越界 ws.ExportAsFixedFormat(0, toFile) # 每一張都需要打印 print("轉(zhuǎn)換至:" + toFileName + "文件完成") except Exception as e: print(e) # 關(guān)閉 Excel 進程 print("所有 Excel 文件已打印完畢") print("結(jié)束 Excel 進程中...\n") ws = None wb.Close() wb = None excel.Quit() excel = None except Exception as e: print(e) finally: gc.collect() # PPT def ppt2Pdf(filePath, ppts): # 如果沒有文件則提示后直接退出 if (len(ppts) < 1): print("\n【無 PPT 文件】\n") return # 開始轉(zhuǎn)換 print("\n【開始 PPT -> PDF 轉(zhuǎn)換】") try: print("打開 PowerPoint 進程中...") powerpoint = win32com.client.Dispatch("PowerPoint.Application") ppt = None # 某文件出錯不影響其他文件打印 for i in range(len(ppts)): print(i) fileName = ppts[i] # 文件名稱 fromFile = os.path.join(filePath, fileName) # 文件地址 toFileName = changeSufix2Pdf(fileName) # 生成的文件名稱 toFile = toFileJoin(filePath, toFileName) # 生成的文件地址 print("轉(zhuǎn)換:" + fileName + "文件中...") try: ppt = powerpoint.Presentations.Open(fromFile, WithWindow=False) if ppt.Slides.Count > 0: ppt.SaveAs(toFile, 32) # 如果為空則會跳出提示框(暫時沒有找到消除辦法) print("轉(zhuǎn)換至:" + toFileName + "文件完成") else: print("(錯誤,發(fā)生意外:此文件為空,跳過此文件)") except Exception as e: print(e) # 關(guān)閉 PPT 進程 print("所有 PPT 文件已打印完畢") print("結(jié)束 PowerPoint 進程中...\n") ppt.Close() ppt = None powerpoint.Quit() powerpoint = None except Exception as e: print(e) finally: gc.collect() # 修改后綴名 def changeSufix2Pdf(file): return file[:file.rfind('.')] + ".pdf" # 添加工作簿序號 def addWorksheetsOrder(file, i): return file[:file.rfind('.')] + "_工作表" + str(i) + ".pdf" # 轉(zhuǎn)換地址 def toFileJoin(filePath, file): return os.path.join(filePath, 'pdf', file[:file.rfind('.')] + ".pdf") # 開始程序 print("====================程序開始====================") print( "【程序功能】將目標(biāo)路徑下內(nèi)所有的 ppt、excel、word 均生成一份對應(yīng)的 PDF 文件,存在新生成的 pdf 文件夾中(需已經(jīng)安裝office,不包括子文件夾)") print( "注意:若某 PPT 和 Excel 文件為空,則會出錯跳過此文件。若轉(zhuǎn)換 PPT 時間過長,請查看是否有報錯窗口等待確認(rèn),暫時無法徹底解決 PPT 的窗口問題(為空錯誤已解決)。在關(guān)閉進程過程中,時間可能會較長,十秒左右,請耐心等待。") # 需要轉(zhuǎn)換的文件路徑 # filePath = input("輸入目標(biāo)路徑:(若為當(dāng)前路徑:" + os.getcwd() + ",請直接回車)\n") filePath = "D:\Pycharmproject2023\code_test_project\shan_test\data" # 目標(biāo)路徑,若沒有輸入路徑則為當(dāng)前路徑 if (filePath == ""): filePath = os.getcwd() # 將目標(biāo)文件夾所有文件歸類,轉(zhuǎn)換時只打開一個進程 words = [] ppts = [] excels = [] for fn in os.listdir(filePath): if fn.endswith(('.doc', 'docx')): words.append(fn) if fn.endswith(('.ppt', 'pptx')): ppts.append(fn) if fn.endswith(('.xls', 'xlsx')): excels.append(fn) # 調(diào)用方法 print("====================開始轉(zhuǎn)換====================") # 保存路徑:新建 pdf 文件夾,所有生成的 PDF 文件都放在里面 folder = filePath + '\\pdf\\' if not os.path.exists(folder): os.makedirs(folder) word2Pdf(filePath, words) excel2Pdf(filePath, excels) ppt2Pdf(filePath, ppts) print("====================轉(zhuǎn)換結(jié)束====================") print("\n====================程序結(jié)束====================") # os.system("pause")
三、實踐效果
以上就是Python批量實現(xiàn)Word/EXCEL/PPT轉(zhuǎn)PDF的詳細(xì)內(nèi)容,更多關(guān)于python word excel ppt轉(zhuǎn)pdf的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
對python多線程中互斥鎖Threading.Lock的簡單應(yīng)用詳解
今天小編就為大家分享一篇對python多線程中互斥鎖Threading.Lock的簡單應(yīng)用詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01使用SQLAlchemy操作數(shù)據(jù)庫表過程解析
這篇文章主要介紹了使用SQLAlchemy操作數(shù)據(jù)庫表過程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-06-06Python pandas RFM模型應(yīng)用實例詳解
這篇文章主要介紹了Python pandas RFM模型應(yīng)用,結(jié)合實例形式詳細(xì)分析了pandas RFM模型的概念、原理、應(yīng)用及相關(guān)操作注意事項,需要的朋友可以參考下2019-11-11Python實現(xiàn)點陣字體讀取與轉(zhuǎn)換的方法
今天小編就為大家分享一篇Python實現(xiàn)點陣字體讀取與轉(zhuǎn)換的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01Python請求庫發(fā)送HTTP POST請求的示例代碼
這段代碼使用了Python的requests庫來發(fā)送HTTP POST請求,向本地服務(wù)器的API發(fā)送數(shù)據(jù),并處理響應(yīng),一步步解釋這個代碼2024-08-08