python?selenium保存圖片最好的兩種方法
selenium爬取頁面時(shí)經(jīng)常遇到要保存圖片的需求,通常的做法是獲取鏈接后用 requests 下載,但這種方法脫離了selenium環(huán)境,如遇到有校驗(yàn)的情況還需要繞過校驗(yàn)。
下面介紹兩種直接通過selenium保存圖片的方法:
1. 通過抓包
selenium-wire 是selenium擴(kuò)展,它可以對所有請求抓包,同時(shí)還可以修改請求頭,請求body,請求返回值等,功能非常強(qiáng)大。
selenium-wire 的使用和selenium一樣,你只從seleniumwire導(dǎo)入webdriver就行,對于其他包還是從selenium導(dǎo)入
from selenium.webdriver.chrome.options import Options from seleniumwire.webdriver import Chrome driver = Chrome(options= Options())
下載圖片有兩種方法:
1-1.通過攔截器
通過攔截器預(yù)先把所有圖片保存下來,要用到時(shí)在緩存目錄中找
def get_img_path_from_url(url):
# 自行實(shí)現(xiàn)
return url
def response_interceptor(request, response):
t=response.headers['Content-Type']
if request.host=='xxx' and t and 'image' in t:
with open(get_img_path_from_url(request.url), 'wb') as f:
f.write(response.body)
driver.response_interceptor = response_interceptor
driver.get('...')
src=driver.find_element_by_tag_name('img').get_attribute('src')
img_path=get_img_path_from_url(src)
1-2. 請求后在所有請求中獲取
這種方法有個(gè)缺點(diǎn),瀏覽器會自動緩存圖片,如果之前已經(jīng)緩存過這張圖片是不會有網(wǎng)絡(luò)請求的
# 下載前先清理數(shù)據(jù),不然請求太多
del driver.requests
driver.get('...')
src=driver.find_element_by_tag_name('img').get_attribute('src')</code>
<code>
for r in driver.iter_requests():
if r.url==src:
with open('img', 'wb') as f:
f.write(r.response.body)2. 通過canvas
使用js把圖片放到canvas中,然后獲取base64字符串,再保存
import base64
import os
import re
from io import BytesIO
from PIL import Image
def base64_to_image(base64_str):
base64_data = re.sub('^data:image/.+;base64,', '', base64_str)
byte_data = base64.b64decode(base64_data)
image_data = BytesIO(byte_data)
img = Image.open(image_data)
return img
js = "let c = document.createElement('canvas');let ctx = c.getContext('2d');" \
"let img = document.getElementsByTagName('img')[0]; /*找到圖片*/ " \
"c.height=img.naturalHeight;c.width=img.naturalWidth;" \
"ctx.drawImage(img, 0, 0,img.naturalWidth, img.naturalHeight);" \
"let base64String = c.toDataURL();return base64String;"
base64_str = driver.execute_script(js)
img = base64_to_image(base64_str)
img.save('xx.png')總結(jié)
到此這篇關(guān)于python selenium保存圖片最好的兩種方法的文章就介紹到這了,更多相關(guān)python selenium保存圖片內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python實(shí)現(xiàn)可將字符轉(zhuǎn)換成大寫的tcp服務(wù)器實(shí)例
這篇文章主要介紹了python實(shí)現(xiàn)可將字符轉(zhuǎn)換成大寫的tcp服務(wù)器,通過tcp服務(wù)器端實(shí)現(xiàn)針對字符的轉(zhuǎn)換與返回功能,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-04-04
Python實(shí)現(xiàn)的多進(jìn)程拷貝文件并顯示百分比功能示例
這篇文章主要介紹了Python實(shí)現(xiàn)的多進(jìn)程拷貝文件并顯示百分比功能,涉及Python多進(jìn)程、文件遍歷、拷貝等相關(guān)操作技巧,需要的朋友可以參考下2019-04-04
Pyramid將models.py文件的內(nèi)容分布到多個(gè)文件的方法
默認(rèn)的Pyramid代碼結(jié)構(gòu)中,就只有一個(gè)models.py文件,在實(shí)際項(xiàng)目中,如果需要對models進(jìn)行分類,放到不同文件下,應(yīng)該怎么辦2013-11-11

