Python使用pyh生成HTML文檔的方法示例
最近在項(xiàng)目中需要將結(jié)果導(dǎo)出到HTML中,在網(wǎng)上搜索的時(shí)候發(fā)現(xiàn)了這個(gè)庫(kù),通過官方的一些文檔以及網(wǎng)上的博客發(fā)現(xiàn)它的使用還是很簡(jiǎn)單的,因此選擇在項(xiàng)目中使用它。
在使用的時(shí)候發(fā)現(xiàn)在Python3中有些問題,網(wǎng)上很多地方都沒有提到,因此我在這將它的使用以及我遇到的問題和解決方案整理出來供大家參考
本文主要參考 pyh中文文檔
下載的樣本也是該文中提到的地址
常規(guī)使用
在使用時(shí)一般先導(dǎo)入模塊:
from phy import *
然后可以創(chuàng)建一個(gè)PyH對(duì)象就像這樣
page = PyH(title)
其中title是一個(gè)字符串,這個(gè)字符串將作為頁面的標(biāo)題顯示,也就是說此時(shí)產(chǎn)生的HTML代碼就是在頭部加上一個(gè)title標(biāo)簽并將這個(gè)字符串作為文本值
然后我們可以addCSS方法或者addJS方法引入外部的js文件或者css文件(調(diào)用這兩個(gè)函數(shù)將在HTML的頭部產(chǎn)生一個(gè)引入的代碼,對(duì)于那種在body中添加style代碼的我暫時(shí)沒有找到什么辦法)
然后就是創(chuàng)建標(biāo)簽對(duì)象,對(duì)應(yīng)標(biāo)簽類的名字所與在HTML中的對(duì)應(yīng)的名稱相同,傳入對(duì)象的參數(shù)就是標(biāo)簽中的屬性,除了class屬性對(duì)應(yīng)的參數(shù)名稱是cl外,其余的參數(shù)名稱與在HTML中的屬性一一對(duì)應(yīng)。比如我們要?jiǎng)?chuàng)建一個(gè)div標(biāo)簽可以這樣寫
myDiv = div('測(cè)試div', id = 'div1', cl = "cls_div")
最終生成的HTML代碼如下:
<div id = 'div1' class = 'cls_div'>測(cè)試div</div>
將元素加入某個(gè)元素中可以使用<<符號(hào),該符號(hào)返回的是最后被包含的符號(hào)對(duì)象。比如這樣
div(id = 'div1') << p('測(cè)試' cl = 'p_tag')
這句代碼會(huì)返回p元素對(duì)應(yīng)的對(duì)象,而生成的HTML代碼如下:
<div id = 'div1'> <p class = 'p_tag'>測(cè)試</p> </div>
當(dāng)生成了合適的HTML文檔后可以使用printOut方法將其打印,也可以使用render函數(shù)返回對(duì)應(yīng)的HTML代碼,以便我們進(jìn)行存盤或者做進(jìn)一步處理
上面只是簡(jiǎn)單的做一下介紹,詳細(xì)的使用方法請(qǐng)參看上面提到的一篇文章,這上面寫的比較詳細(xì)。下面來通過一個(gè)例子代碼來說明我是如何處理一些出現(xiàn)的錯(cuò)誤、做一些簡(jiǎn)單的擴(kuò)展,并大致看看里面的源代碼
例子
from pyh import * import codecs from xml.sax.saxutils import escape WORD_WIDTH = 100 def create_base(table_title, page): page.addCSS('base.css') #展示信息的表 base_table = page << table(cl = 'diff', id = 'difflib_chg_to0__top', cellspacing = '0', cellpadding = '0', rules = 'groups') for i in range(4): base_table << colgroup() #表頭 t_head = base_table << thead() tr_tag = t_head << tr() tr_tag << th(cl = 'diff_next') << br() tr_tag << th(table_title, colspan = '2', cl = 'diff_header') t_body = base_table << tbody() return t_body #寫入一行信息 def write_line(tr_tag, mark, data): tr_tag << td(mark, cl = 'diff_header') tr_tag << td(data) def txt2html(title, table_title, ifile, ofile): i_f = codecs.open(ifile, 'r',encoding='utf-8') lines = i_f.read().splitlines() i_f.close() page = PyH(title) t_body = create_base(table_title, page) lineno = 1 for data in lines: if len(data) >= WORD_WIDTH: for i in range(len(data) // WORD_WIDTH + 1): sub_data = data[WORD_WIDTH * i: min(WORD_WIDTH * (i + 1), len(data) - 1)] if i == 0: mark = str(lineno) else: mark = '>' tr_tag = t_body << tr() sub_data = escape(sub_data) sub_data = sub_data.replace(" ", " ") sub_data = sub_data.replace("\t", " ") write_line(tr_tag, mark, sub_data) else: tr_tag = t_body << tr() data = escape(data) data = data.replace(" ", " ") data = data.replace("\t", " ") write_line(tr_tag, str(lineno), data) lineno += 1 html = page.render() o_f = codecs.open(ofile, 'w', encoding= 'utf-8') o_f.write(html) o_f.close()
這是一個(gè)將任意文本文件轉(zhuǎn)化為HTML文檔的例子,主要是在調(diào)用txt2html函數(shù),該函數(shù)有4個(gè)參數(shù),頁面的標(biāo)題,展示文本內(nèi)容的表格的標(biāo)題,輸入文件路徑,輸出文件路徑
同時(shí)做了一些簡(jiǎn)單的處理,對(duì)原文檔中的每行進(jìn)行標(biāo)號(hào),同時(shí)設(shè)置一行只顯示100個(gè)字符多余的進(jìn)行換行,以便閱讀
最終打開生成的HTML大致如下:
在Python3環(huán)境下直接運(yùn)行發(fā)現(xiàn)它報(bào)了一個(gè)錯(cuò)誤:
在Python2中存在Unicode字符串和普通字符串的區(qū)別,但是在Python3中所有字符串都默認(rèn)是Unicode的,它取消了關(guān)于Python2中unicode函數(shù),這里報(bào)錯(cuò)主要是這個(gè)原因,因此我們定位到報(bào)錯(cuò)的地方,將代碼進(jìn)行修改,去掉unicode函數(shù)(在Python2中unicode函數(shù)需要傳入一個(gè)普通字符串,因此這里我們只需要去掉unicode函數(shù),保留原來的參數(shù)即可,對(duì)于進(jìn)行字符號(hào)轉(zhuǎn)化的直接注釋或者改為pass即可
解決了unicode問題之后再次運(yùn)行,又報(bào)了這樣一個(gè)錯(cuò)誤
定位到對(duì)應(yīng)代碼處,在原來的代碼位置有這么一段代碼:
def TagFactory(name): class f(Tag): tagname = name f.__name__ = name return f thisModule = modules[__name__] for t in tags: setattr(thisModule, t, TagFactory(t))
從這段代碼上可以知道,每當(dāng)我們通過對(duì)應(yīng)名稱創(chuàng)建一個(gè)標(biāo)簽時(shí),會(huì)在tags里面里面尋找到對(duì)應(yīng)的標(biāo)簽,然后調(diào)用工廠方法生成一個(gè)對(duì)應(yīng)的標(biāo)簽,這個(gè)工廠方法生成的其實(shí)是一個(gè)Tag對(duì)象,并且所有HTML標(biāo)簽都是這個(gè)Tag類,因此可以猜測(cè)如果要添加新的標(biāo)簽對(duì)象,那么可以通過修改tags里面的值,我們加入對(duì)應(yīng)的標(biāo)簽值之后發(fā)現(xiàn)代碼可以運(yùn)行了,至此問題都解決了。
其實(shí)這些錯(cuò)誤都是Python2代碼移植到python3環(huán)境下常見的錯(cuò)誤,至于它的源碼我沒怎么看太明白,主要是它生成標(biāo)簽的這一塊,我也不知道為什么修改了tags之后就可以運(yùn)行了,python類廠的概念我還是不太明白,看來要花時(shí)間好好補(bǔ)一下基礎(chǔ)內(nèi)容了。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- python+jinja2實(shí)現(xiàn)接口數(shù)據(jù)批量生成工具
- Python的Flask框架標(biāo)配模板引擎Jinja2的使用教程
- 為Python的Tornado框架配置使用Jinja2模板引擎的方法
- Python的Flask框架中的Jinja2模板引擎學(xué)習(xí)教程
- python解析html提取數(shù)據(jù),并生成word文檔實(shí)例解析
- python使用 HTMLTestRunner.py生成測(cè)試報(bào)告
- Python3實(shí)現(xiàn)抓取javascript動(dòng)態(tài)生成的html網(wǎng)頁功能示例
- 在Python中使用CasperJS獲取JS渲染生成的HTML內(nèi)容的教程
- python 利用jinja2模板生成html代碼實(shí)例
相關(guān)文章
Python子進(jìn)程subpocess原理及用法解析
這篇文章主要介紹了Python子進(jìn)程subpocess原理及用法解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-07-07教你使用Python?的?Template?類生成文件報(bào)告
這篇文章主要介紹了用?Python?的?Template?類生成文件報(bào)告,在閱讀本文時(shí),您不僅學(xué)習(xí)了Python字符串的基本知識(shí),Template類以及使用它的原因,而且還實(shí)現(xiàn)了第一個(gè)文件報(bào)告腳本,需要的朋友可以參考下2022-08-08Python實(shí)現(xiàn)簡(jiǎn)易端口掃描器代碼實(shí)例
本篇文章主要介紹了Python實(shí)現(xiàn)簡(jiǎn)易端口掃描器的相關(guān)代碼,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下。2017-03-03python腳本設(shè)置超時(shí)機(jī)制系統(tǒng)時(shí)間的方法
這篇文章主要介紹了python腳本設(shè)置超時(shí)機(jī)制系統(tǒng)時(shí)間的方法,感興趣的小伙伴們可以參考一下2016-02-02Python實(shí)戰(zhàn)之外星人入侵游戲示例代碼
這篇文章主要介紹了利用Python編寫的外星人入侵游戲的示例代碼,文中的代碼講解詳細(xì),對(duì)我們學(xué)習(xí)Python有一定的幫助,感興趣的可以學(xué)習(xí)一下2022-01-01利用Python代碼實(shí)現(xiàn)一鍵摳背景功能
這篇文章主要給大家介紹了關(guān)于如何利用Python代碼實(shí)現(xiàn)一鍵摳背景的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用Python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧2019-12-12使用 Python 玩轉(zhuǎn) GitHub 的貢獻(xiàn)板(推薦)
這篇文章主要介紹了使用 Python 玩轉(zhuǎn) GitHub 的貢獻(xiàn)板的相關(guān)知識(shí),非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-04-04