實(shí)操Python爬取覓知網(wǎng)素材圖片示例
【一、項(xiàng)目背景】
???在素材網(wǎng)想找到合適圖片需要一頁(yè)一頁(yè)往下翻,現(xiàn)在學(xué)會(huì)python就可以用程序把所有圖片保存下來(lái),慢慢挑選合適的圖片。
【二、項(xiàng)目目標(biāo)】
1、根據(jù)給定的網(wǎng)址獲取網(wǎng)頁(yè)源代碼。
2、利用正則表達(dá)式把源代碼中的圖片地址過(guò)濾出來(lái)。
3、過(guò)濾出來(lái)的圖片地址下載素材圖片。
【三、涉及的庫(kù)和網(wǎng)站】
1、網(wǎng)址如下:
2、涉及的庫(kù):requests、lxml
【四、項(xiàng)目分析】
???首先需要解決如何對(duì)下一頁(yè)的網(wǎng)址進(jìn)行請(qǐng)求的問(wèn)題??梢渣c(diǎn)擊下一頁(yè)的按鈕,觀察到網(wǎng)站的變化分別如下所示:
https://www.51miz.com/so-sucai/1789243.html https://www.51miz.com/so-sucai/1789243/p_2/ https://www.51miz.com/so-sucai/1789243/p_3/
? ?我們可以發(fā)現(xiàn)圖片頁(yè)數(shù)是1789243/p{},p{}花括號(hào)數(shù)字表示圖片哪一頁(yè)。
【五、項(xiàng)目實(shí)施】
1、打開(kāi)覓知網(wǎng),在搜索中輸入你想要的圖片素材(以鼠年素材圖片為例)。
?
2、根據(jù)上一步對(duì)網(wǎng)址的分析,首先我們定義一個(gè)類叫做ImageSpider,類里面定義初始化函數(shù)、發(fā)送請(qǐng)求獲取響應(yīng)數(shù)據(jù)函數(shù)、解析函數(shù)、主函數(shù)。首先初始化函數(shù),準(zhǔn)備url地址和headers,代碼如下圖所示。
3、發(fā)送請(qǐng)求獲取響應(yīng)數(shù)據(jù)函數(shù)。
4、解析數(shù)據(jù),使用xpath獲取二級(jí)頁(yè)面鏈接,最后把圖片存儲(chǔ)在文件夾中。使用谷歌瀏覽器選擇開(kāi)發(fā)者工具或直接按F12,發(fā)現(xiàn)我們需要的圖片src是在img標(biāo)簽下的,于是用Python的requests提取該組件。
5、主函數(shù),代碼如下圖所示。
【六、效果展示】
1、運(yùn)行程序,在控制臺(tái)輸入你要爬取的頁(yè)數(shù),如下圖所示。
2、在本地可以看到效果圖,如下圖所示。
【七、總結(jié)】
???1、不建議抓取太多數(shù)據(jù),容易對(duì)服務(wù)器造成負(fù)載,淺嘗輒止即可。
???2、希望通過(guò)這個(gè)項(xiàng)目,能夠幫助大家下載到素材圖片。
???3、本文基于Python網(wǎng)絡(luò)爬蟲(chóng),利用爬蟲(chóng)庫(kù),實(shí)現(xiàn)素材圖片的獲取。實(shí)現(xiàn)的時(shí)候,總會(huì)有各種各樣的問(wèn)題,切勿眼高手低,勤動(dòng)手,才可以理解的更加深刻。
到此這篇關(guān)于實(shí)操Python爬取覓知網(wǎng)素材圖片示例的文章就介紹到這了,更多相關(guān)Python爬取覓知網(wǎng)素材圖片內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python獲取本機(jī)所有網(wǎng)卡ip,掩碼和廣播地址實(shí)例代碼
這篇文章主要介紹了Python獲取本機(jī)所有網(wǎng)卡ip,掩碼和廣播地址實(shí)例代碼,小編覺(jué)得還是挺不錯(cuò)的,具有一定借鑒價(jià)值,需要的朋友可以參考下2018-01-01Python?十大經(jīng)典排序算法實(shí)現(xiàn)詳解
排序算法是《數(shù)據(jù)結(jié)構(gòu)與算法》中最基本的算法之一。排序算法可以分為內(nèi)部排序和外部排序,內(nèi)部排序是數(shù)據(jù)記錄在內(nèi)存中進(jìn)行排序,而外部排序是因排序的數(shù)據(jù)很大,一次不能容納全部的排序記錄,在排序過(guò)程中需要訪問(wèn)外存2022-01-01python 從遠(yuǎn)程服務(wù)器下載日志文件的程序
本文提供了一種方法,該程序可實(shí)現(xiàn)抓取服務(wù)器的日志文件到本地,根據(jù)該程序可自行擴(kuò)展對(duì)日志文件的自動(dòng)化分析。常用于數(shù)據(jù)挖掘、生產(chǎn)維護(hù)等2013-02-02PowerBI和Python關(guān)于數(shù)據(jù)分析的對(duì)比
這篇文章主要介紹了PowerBI和Python關(guān)于數(shù)據(jù)分析的對(duì)比,很多經(jīng)常會(huì)用到數(shù)據(jù)分析的伙伴會(huì)問(wèn)有沒(méi)有一款便捷好用的工具!肯定有啊,Python的出現(xiàn)和普及,很容易就能改變這些窘境,需要的朋友可以參考下2019-07-07Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例
這篇文章主要介紹了Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-12-12淺談numpy中函數(shù)resize與reshape,ravel與flatten的區(qū)別
這篇文章主要介紹了淺談numpy中函數(shù)resize與reshape,ravel與flatten的區(qū)別介紹,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-06-06Python之虛擬環(huán)境virtualenv,pipreqs生成項(xiàng)目依賴第三方包的方法
今天小編就為大家分享一篇Python之虛擬環(huán)境virtualenv,pipreqs生成項(xiàng)目依賴第三方包的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07python對(duì)列進(jìn)行平移變換的方法(shift)
今天小編就為大家分享一篇python對(duì)列進(jìn)行平移變換的方法(shift),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01OpenCV實(shí)現(xiàn)去除背景識(shí)別的方法總結(jié)
這篇文章主要為大家詳細(xì)介紹了如何利用OpenCV實(shí)現(xiàn)去除背景識(shí)別的功能,文中為大家總結(jié)了一些方法,感興趣的小伙伴快跟隨小編一起學(xué)習(xí)一下2022-10-10