Python如何提取chm數(shù)據(jù)
Python提取chm數(shù)據(jù)
需求場景
chm格式文檔中的內(nèi)容,提取保存為html
- 方法一 使用在線轉(zhuǎn)換工具或者軟件
- 方法二 腳本編譯
step 1:.bat腳本反編譯
使用該腳本, 可以將chm文件反編譯,類似解壓,獲取文件。有些文檔可以直接轉(zhuǎn)換為txt,有些會轉(zhuǎn)化為html. 這個(gè)跟生成chm文件有關(guān)系。
1 新建txt文檔, 參照示例寫入命令。保存后文件另存為.bat格式
hh -decompile 轉(zhuǎn)換結(jié)果輸出路徑 待轉(zhuǎn)換文件(相對/絕對路徑) # 示例 hh -decompile D:\Desktop\ 123.chm
2 右鍵 管理員身份運(yùn)行該文件即可,結(jié)果輸出到命令指定的目錄
step 2: html轉(zhuǎn)txt
【html】Python提取html中文本到txt
查用python自帶的.chm官方文檔
1.去python的官方網(wǎng)站去下載對應(yīng)版本的python,在這里下載的python會自帶一份官方文檔(根據(jù)操作系統(tǒng)選擇的不同,會有不同的格式),下載windows版本的會有一個(gè)(*.chm)格式的說明文檔
下載好后進(jìn)入下載目錄,找到Doc目錄,進(jìn)入
我的是windows系統(tǒng),可以看到有個(gè)5-6兆的(*.chm)說明文檔
windows下可以直接雙擊打開。
打開后的樣子,可以看到很多目錄,充滿了知識,等待著去發(fā)掘。
如果我對python自帶的某個(gè)庫的使用十分不解,比如copy,
我應(yīng)該這樣查
想找python基本的數(shù)據(jù)類型以及使用來學(xué)習(xí)
可以這樣來找
python自帶的(內(nèi)建的)函數(shù)有很多,了解一下
python自帶了的各種異常,快來捕獲吧
python語言是一種解釋型語言,很大程度上解決了跨平臺開發(fā)的難度,關(guān)于python的各種接口(interface)調(diào)用,以及對操作系統(tǒng)的支持,都可以查到。
關(guān)于英語的問題,大可不必?fù)?dān)心,有道云翻譯提供截屏翻譯,鼠標(biāo)取詞翻譯,是十分方便的,快去學(xué)習(xí)吧!
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python利用shutil模塊實(shí)現(xiàn)文件夾的復(fù)制刪除與裁剪
shutil模塊是對os模塊的補(bǔ)充,主要針對文件的拷貝、刪除、移動(dòng)、壓縮和解壓操作。本文將利用shutil模塊實(shí)現(xiàn)文件夾的復(fù)制刪除與裁剪,需要的可以參考一下2022-05-05python把數(shù)據(jù)框?qū)懭隡ySQL的方法
這篇文章主要介紹了如何讓python把數(shù)據(jù)框?qū)懭隡ySQL,下文利用上海市2016年9月1日公共交通卡刷卡數(shù)據(jù)的一份數(shù)據(jù)單展開其方法,需要的小伙伴可以參考一下2022-03-03Python實(shí)現(xiàn)的讀取電腦硬件信息功能示例
這篇文章主要介紹了Python實(shí)現(xiàn)的讀取電腦硬件信息功能,結(jié)合實(shí)例形式分析了Python基于wmi庫讀取電腦CPU、磁盤、網(wǎng)絡(luò)、進(jìn)程等硬件信息相關(guān)操作技巧,需要的朋友可以參考下2018-05-05pytorch中model.train()和model.eval()用法及說明
在PyTorch中,model.train()用于啟用BatchNormalization和Dropout,保證模型在訓(xùn)練階段能夠有效地利用這些層的特性,而model.eval()則是用于測試階段,確保BatchNormalization和Dropout不會影響測試結(jié)果,保持模型的穩(wěn)定性2024-09-09Django用戶認(rèn)證系統(tǒng) 組與權(quán)限解析
這篇文章主要介紹了Django用戶認(rèn)證系統(tǒng) 組與權(quán)限解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-08-08Django如何實(shí)現(xiàn)密碼錯(cuò)誤報(bào)錯(cuò)提醒
這篇文章主要介紹了Django如何實(shí)現(xiàn)密碼錯(cuò)誤報(bào)錯(cuò)提醒,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值2020-09-09