python抓取網(wǎng)頁(yè)中鏈接的靜態(tài)圖片
本文實(shí)例為大家分享了python抓取網(wǎng)頁(yè)中鏈接的靜態(tài)圖片的具體代碼,供大家參考,具體內(nèi)容如下
# -*- coding:utf-8 -*- #http://tieba.baidu.com/p/2460150866 #抓取圖片地址 from bs4 import BeautifulSoup import urllib.request from time import sleep html_doc = "http://tieba.baidu.com/p/2460150866" def get_image(url): req = urllib.request.Request(url) webpage = urllib.request.urlopen(req) html = webpage.read() soup = BeautifulSoup(html, 'html.parser') #抓取圖片地址 #抓取img標(biāo)簽且class為BDE_Image的所有內(nèi)容 img_src=soup.findAll("img",{'class':'BDE_Image'}) i = 1 for img in img_src: img_url = img.get('src') #抓取src # print(img) req = urllib.request.Request(img_url) u = urllib.request.urlopen(req) data = u.read() with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: sleep(2) f.write(data) i += 1 def getImg(url): html = urllib.request(url) page = html.read() soup = BeautifulSoup(page, "html.parser") imglist = soup.find_all('img') #發(fā)現(xiàn)html中帶img標(biāo)簽的數(shù)據(jù),輸出格式為<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx,存入集合 lenth = len(imglist) #計(jì)算集合的個(gè)數(shù) for i in range(lenth): print imglist[i].attrs['src'] #抓取img中屬性為src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,則輸出為123456
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- Python爬蟲(chóng)抓取指定網(wǎng)頁(yè)圖片代碼實(shí)例
- Python3簡(jiǎn)單爬蟲(chóng)抓取網(wǎng)頁(yè)圖片代碼實(shí)例
- Python爬蟲(chóng)之網(wǎng)頁(yè)圖片抓取的方法
- Python之多線(xiàn)程爬蟲(chóng)抓取網(wǎng)頁(yè)圖片的示例代碼
- Python實(shí)現(xiàn)簡(jiǎn)單網(wǎng)頁(yè)圖片抓取完整代碼實(shí)例
- Python使用正則表達(dá)式抓取網(wǎng)頁(yè)圖片的方法示例
- python抓取網(wǎng)頁(yè)中圖片并保存到本地
- 使用Python3編寫(xiě)抓取網(wǎng)頁(yè)和只抓網(wǎng)頁(yè)圖片的腳本
- Python抓取網(wǎng)頁(yè)圖片難點(diǎn)分析
相關(guān)文章
利用python設(shè)計(jì)圖像加密技術(shù)(Arnold算法)
這篇文章主要介紹了利用python設(shè)計(jì)圖像加密技術(shù)(Arnold算法),本文將借助Arnold置亂法,講解如何用python從頭至尾設(shè)計(jì)出一套圖像加密算法,需要的小伙伴可以才參考一下2022-03-03Window系統(tǒng)下Python如何安裝OpenCV庫(kù)
這篇文章主要介紹了Window系統(tǒng)下Python如何安裝OpenCV庫(kù),本文分步驟給大家介紹的詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-03-03Python Loguru輕松靈活的日志管理庫(kù)基本用法探索
Loguru是一個(gè)用于Python的高性能、簡(jiǎn)潔且靈活的日志庫(kù),它的目標(biāo)是提供一種簡(jiǎn)單的方式來(lái)記錄應(yīng)用程序的運(yùn)行情況,同時(shí)保持代碼的簡(jiǎn)潔性和可讀性,本文將探索loguru的基本用法2024-01-01python執(zhí)行shell并獲取結(jié)果的詳細(xì)示例
在Python中執(zhí)行Shell命令并獲取其結(jié)果,通??梢允褂胹ubprocess模塊,這個(gè)模塊允許我們啟動(dòng)新的進(jìn)程,連接到它們的輸入/輸出/錯(cuò)誤管道,并獲取它們的返回碼,下面是一個(gè)詳細(xì)的示例,展示了如何使用subprocess.run()函數(shù)來(lái)執(zhí)行Shell命令并獲取其輸出,需要的朋友可以參考下2024-07-07在Linux系統(tǒng)上通過(guò)uWSGI配置Nginx+Python環(huán)境的教程
這篇文章主要介紹了在Linux系統(tǒng)上通過(guò)uWSGI配置Nginx+Python環(huán)境的教程,示例中為Ubuntu系統(tǒng)并且默認(rèn)使用系統(tǒng)中自帶的Python解釋器,需要的朋友可以參考下2015-12-12python函數(shù)也可以是一個(gè)對(duì)象,可以存放在列表中并調(diào)用方式
這篇文章主要介紹了python函數(shù)也可以是一個(gè)對(duì)象,可以存放在列表中并調(diào)用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-02-02Python實(shí)現(xiàn)子類(lèi)調(diào)用父類(lèi)的初始化實(shí)例
這篇文章主要介紹了Python實(shí)現(xiàn)子類(lèi)調(diào)用父類(lèi)的初始化實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-03-03python入門(mén)字符串拼接\截取\轉(zhuǎn)數(shù)字理解學(xué)習(xí)
本篇內(nèi)容我們主要講有關(guān)Python字符串的用法,包括字符串的拼接、字符串怎么轉(zhuǎn)數(shù)字、字符串的格式化、字符串函數(shù)等內(nèi)容,有需要的朋友可以借鑒參考下2021-09-09