python使用htmllib分析網(wǎng)頁(yè)內(nèi)容的方法
本文實(shí)例講述了python使用htmllib分析網(wǎng)頁(yè)內(nèi)容的方法。分享給大家供大家參考。具體實(shí)現(xiàn)方法如下:
import htmllib, urllib, formatter, sys website = urllib.urlopen("http://yourweb.com") data = website.read() website.close() format = formatter.AbstractFormatter(formatter.DumbWriter(sys.stdout)) ptext = htmllib.HTMLParser(format) ptext.feed(data) ptext.close()
希望本文所述對(duì)大家的Python程序設(shè)計(jì)有所幫助。
相關(guān)文章
Python實(shí)現(xiàn)PS濾鏡中的USM銳化效果
這篇文章主要介紹了Python實(shí)現(xiàn)PS濾鏡中的USM銳化效果,幫助大家更好的利用python處理圖片,感興趣的朋友可以了解下2020-12-12scrapy+scrapyd+gerapy?爬蟲(chóng)調(diào)度框架超詳細(xì)教程
Scrapy吸引人的地方在于它是一個(gè)框架,任何人都可以根據(jù)需求方便的修改。它也提供了多種類(lèi)型爬蟲(chóng)的基類(lèi),如BaseSpider、sitemap爬蟲(chóng)等,最新版本又提供了web2.0爬蟲(chóng)的支持,這篇文章主要介紹了scrapy+scrapyd+gerapy?爬蟲(chóng)調(diào)度框架超詳細(xì)教程,需要的朋友可以參考下2022-06-06pandas組內(nèi)排序,并在每個(gè)分組內(nèi)按序打上序號(hào)的操作
這篇文章主要介紹了pandas組內(nèi)排序,并在每個(gè)分組內(nèi)按序打上序號(hào)的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03pandas數(shù)據(jù)清洗,排序,索引設(shè)置,數(shù)據(jù)選取方法
下面小編就為大家分享一篇pandas數(shù)據(jù)清洗,排序,索引設(shè)置,數(shù)據(jù)選取方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-05-05python人工智能算法之差分進(jìn)化算法的實(shí)現(xiàn)
DE基于GA,正如進(jìn)化基于遺傳,和遺傳算法相比,差分進(jìn)化引入了差分變異模式,相當(dāng)于開(kāi)辟了一條嶄新的進(jìn)化路徑,下面就來(lái)看看差分優(yōu)化算法是如何實(shí)現(xiàn)的吧2023-08-08