python抓取網(wǎng)頁圖片并放到指定文件夾
更新時間:2014年04月24日 10:13:54 作者:
這篇文章主要介紹了python抓取網(wǎng)頁圖片并放到指定文件夾,需要的朋友可以參考下
python抓取網(wǎng)站圖片并放到指定文件夾
復制代碼 代碼如下:
# -*- coding=utf-8 -*-
import urllib2
import urllib
import socket
import os
import re
def Docment():
print u'把文件存在E:\Python\圖(請輸入數(shù)字或字母)'
h=raw_input()
path=u'E:\Python\圖'+str(h)
if not os.path.exists(path):
os.makedirs(path)
return path
def getallurl(html):
reg=r"a href='(.*?\.htm)'"
allurl= re.compile(reg)
allList = re.findall(allurl,html)
return allList
def getHTML(url):
url=url
req_header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
req_timeout = 20
html='cuowu'
try:
req = urllib2.Request(url,None,req_header)
resp = urllib2.urlopen(req,None,req_timeout)
html = resp.read()
except urllib2.URLError as e:
print e.message
except socket.timeout as e:
getHTML(url,fu)
return html
def getImg(html,path):
reg = r'img class=IMG_show border=0 src=(.*?\.jpg)'
imgre= re.compile(reg)
imgList = re.findall(imgre, html)
if imgList:
print 'ghasghg',path
for imgurl in imgList:
print imgurl
content2=urllib2.urlopen(imgurl).read()
with open(path+'/'+imgurl[-7:],'wb') as code:
code.write(content2)
else:
return 0
def getallurl(html):
reg=r"a href='(.*?\.htm)'"
allurl= re.compile(reg)
allList = re.findall(allurl,html)
return allList
j=1
i=0
print u'請輸入網(wǎng)址:'
ul=raw_input()
print u'開始下載'
print u'第'+str(j)+u'頁'
html=getHTML(ul)
allList=getallurl(html)
path=Docment()
getImg(html,path)
while i<len(allList):
for lis in allList:
l=lis[i]
url=r'http://www.umei.cc/p/gaoqing/rihan/'+lis
i=i+1
j=j+1
html=getHTML(url)
getImg(html,path)
print u'第'+str(j)+u'頁'
else:
print u'下載完畢'
您可能感興趣的文章:
- Python 抓取動態(tài)網(wǎng)頁內(nèi)容方案詳解
- 零基礎寫python爬蟲之使用urllib2組件抓取網(wǎng)頁內(nèi)容
- python抓取網(wǎng)頁內(nèi)容示例分享
- Python實現(xiàn)周期性抓取網(wǎng)頁內(nèi)容的方法
- python抓取網(wǎng)頁中圖片并保存到本地
- Python3使用requests包抓取并保存網(wǎng)頁源碼的方法
- 用Python程序抓取網(wǎng)頁的HTML信息的一個小實例
- Python實現(xiàn)抓取網(wǎng)頁并且解析的實例
- Python爬蟲實現(xiàn)網(wǎng)頁信息抓取功能示例【URL與正則模塊】
- Python簡單實現(xiàn)網(wǎng)頁內(nèi)容抓取功能示例
相關(guān)文章
python將Dataframe格式的數(shù)據(jù)寫入opengauss數(shù)據(jù)庫并查詢
這篇文章主要介紹了python將Dataframe格式的數(shù)據(jù)寫入opengauss數(shù)據(jù)庫并查詢,文章介紹詳細具有一定的參考價值,希望對你的學習有所幫助2022-04-04Django項目uwsgi+Nginx保姆級部署教程實現(xiàn)
這篇文章主要介紹了Django項目uwsgi+Nginx保姆級部署教程實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-04-04Python大數(shù)據(jù)之從網(wǎng)頁上爬取數(shù)據(jù)的方法詳解
這篇文章主要介紹了Python大數(shù)據(jù)之從網(wǎng)頁上爬取數(shù)據(jù)的方法,結(jié)合實例形式詳細分析了Python爬蟲爬取網(wǎng)頁數(shù)據(jù)的相關(guān)操作技巧,需要的朋友可以參考下2019-11-11Python Barbershop實現(xiàn)照片換發(fā)型功能
這篇文章主要為大家介紹了一個開源項目(Barbershop),可以將照片中的發(fā)型更換成另一個,文中實現(xiàn)過程講解詳細,感興趣的可以學習一下2022-01-01python程序中的線程操作 concurrent模塊使用詳解
這篇文章主要介紹了python程序中的線程操作 concurrent模塊使用詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2019-09-09