批處理從html格式(接收到的郵件)中讀取數(shù)據(jù)的操作方法
通過第三方批處理getmail可以獲取到郵箱里的郵件。獲取后經(jīng)其自身解碼,得到一個(gè)Extract*.out文件,大致看一下其格式應(yīng)該為html的寫法,并且內(nèi)容只分一行。
<div dir="auto">here is the content</div>
顯然我郵件發(fā)送的原內(nèi)容為:
here is the content
現(xiàn)在要提取出其中的原內(nèi)容并且將所有內(nèi)容合并到一行。問題在于,郵箱不一定每次都接收到這樣簡單的文件。例如內(nèi)容當(dāng)中出現(xiàn)換行:
<div dir="auto">abababababababab<br /><br />abababababababab<br /><br /></div>
有時(shí)內(nèi)容含特殊字符,解碼之后也無法正常顯示(某些字符):
i wanna get these words # $ % & * @ ? !
<div dir="auto">i wanna get these words # $ % & * @ ? !</div>
有時(shí)發(fā)送的內(nèi)容經(jīng)過復(fù)制粘貼,不小心留下了其他信息:
<div dir="auto">hey get it <span style="font-family:sans-serif">hey get it </span><br style="font-family:sans-serif" /><span style="font-family:sans-serif">hey get it </span><span style="font-family:sans-serif">hey get it </span><br style="font-family:sans-serif" /></div>
顯然需要忽略<>標(biāo)簽里的所有內(nèi)容才能得到原內(nèi)容,并且需要還原未正常顯示的符號。
可能要用到第三方了……
到此這篇關(guān)于批處理從html格式(接收到的郵件)中讀取數(shù)據(jù)的操作方法的文章就介紹到這了,更多相關(guān)批處理html格式讀取數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
黑客基礎(chǔ)之DOS (最齊全)超強(qiáng)推薦
黑客基礎(chǔ)之DOS (最齊全)超強(qiáng)推薦...2006-12-12使用批處理實(shí)現(xiàn)軟件的自動(dòng)安裝以安裝搜狗拼音為例
軟件的自動(dòng)安裝我們可以通過使用批處理實(shí)現(xiàn),下面以安裝搜狗拼音為例做個(gè)小實(shí)驗(yàn),其他軟件可以參考此例,具體的實(shí)現(xiàn)如下,喜歡的朋友不要錯(cuò)過2013-11-11bat運(yùn)行時(shí)不彈出那個(gè)黑框框的完美解決方案
bat運(yùn)行時(shí)不彈出那個(gè)黑框框的完美解決方案...2006-12-12批處理按要求將字符串分段輸出的實(shí)現(xiàn)代碼
批處理按要求將字符串分段輸出的實(shí)現(xiàn)代碼,需要的朋友可以參考下。2010-10-10全盤刪除所有文件夾下的_desktop.ini的批處理bat文件
這篇文章主要介紹了用批處理刪除所有盤的desktop.ini的代碼,需要的朋友可以參考下2007-08-08