Python爬蟲中Selenium實(shí)現(xiàn)文件上傳
前言:大部分的文件上傳功能都是用input標(biāo)簽實(shí)現(xiàn),這樣就完全可以把它看作一個輸入框,可以通過send_keys()指定文件進(jìn)行上傳了。
本章中用到的關(guān)鍵方法如下:
send_keys():上傳文件或者輸入文本
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get('http://file.yiyuen.com/file/')
# 定位上傳按鈕,添加本地文件
driver.find_element_by_name("files").send_keys('D:\\test.txt')
time.sleep(10)
driver.quit()
Web上本地上傳圖片,彈出的框Selenium是無法識別的,也就是說,selenium本身沒有直接的方法去實(shí)現(xiàn)上傳本地文件,這里總結(jié)了兩種上傳文件的方式。
一、利用Robot類處理文件上傳。
其大致流程可以為:
1、 利用selenium點(diǎn)擊web上本地文件的上傳按鈕;
2、 在彈出的彈框中,文件路徑輸入框默認(rèn)的是光標(biāo)的聚焦,將文件在磁盤上的路徑通過拷貝和黏貼的方法寫上去。
3、 通過按下回車,默認(rèn)觸發(fā)彈框的確定按鈕,完成文件上傳的功能。
這里以百度首頁的利用圖片搜索為例:
打開百度首頁,搜索按鈕左側(cè)有一個照相機(jī)的圖標(biāo),點(diǎn)擊可以選擇圖片搜索,我們通過本地上傳圖片的過程來模擬文件自動化上傳操作。準(zhǔn)備條件,在百度圖片搜索一個圖片,保存到桌面,例如找到一個關(guān)于selenium的圖片,然后保存在桌面,名稱為selenium.jpg。
相關(guān)實(shí)現(xiàn)代碼如下:
package first;
import java.awt.Robot;
import java.awt.Toolkit;
import java.awt.datatransfer.StringSelection;
import java.awt.event.KeyEvent;
import java.util.concurrent.TimeUnit;
import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.firefox.FirefoxDriver;
public class shangchuang {
public static void main(String[] args)throws Exception {
WebDriver driver=new FirefoxDriver();
driver.manage().window().maximize();
driver.manage().timeouts().implicitlyWait(4, TimeUnit.SECONDS);
driver.get("https://www.baidu.com");
//指定圖片路徑
StringSelection selection=new StringSelection("C:\\Users\\你的用戶名\\Desktop\\selenium.jpg");
//把圖片路徑復(fù)制到剪切板
Toolkit.getDefaultToolkit().getSystemClipboard().setContents(selection, null);
System.out.println("selection"+selection);
//點(diǎn)擊照相機(jī)這個工具
driver.findElement(By.xpath("http://*/span[@class='soutu-btn']")).click();
//點(diǎn)擊本地上傳圖片
driver.findElement(By.xpath("http://*/div[@class='upload-wrap']")).click();
//新建一個Robot類的對象
Robot robot=new Robot();
Thread.sleep(1000);
//按下Ctrl+V
robot.keyPress(KeyEvent.VK_CONTROL);
robot.keyPress(KeyEvent.VK_V);
//釋放Ctrl+V
robot.keyRelease(KeyEvent.VK_CONTROL);
robot.keyRelease(KeyEvent.VK_V);
Thread.sleep(2000);
//點(diǎn)擊回車
robot.keyPress(KeyEvent.VK_ENTER);
robot.keyRelease(KeyEvent.VK_ENTER);
}
}
二、利用AutoIt上傳文件
以上是第一種方的實(shí)現(xiàn),第二種方式是利用AutoIt這個工具。這是一個能支持桌面GUI自動化的工具,它支持腳本語言編寫。在Selenium腳本中如果需要AutoIt來協(xié)助這個文件上傳功能,大概步驟是這樣的:
1. Selenium點(diǎn)擊web產(chǎn)品上的文件上傳按鈕,彈窗上傳框。
2.執(zhí)行AutoIt實(shí)現(xiàn)準(zhǔn)備好的腳本文件,這個腳本文件寫了關(guān)于上傳什么文件的一個.exe文件。
在一切測試工作之前,我們先下載和安裝AutoIt。
1)打開AutoIt的官網(wǎng)下載地址
https://www.autoitscript.com/site/autoit/downloads/
2)點(diǎn)擊下載zip,當(dāng)然也可以下載Editor。

解壓得到的效果如圖:

3)點(diǎn)擊SciTe文件夾,我們打開腳本編輯器。雙擊SciTE.exe

4)打開百度圖片上傳窗口,同時打開AutoIt 腳本編輯器和元素定位器。拖動元素定位器上那個靶點(diǎn)形狀按鈕到文件上傳彈窗,能夠捕獲到一些元素信息。

5)在AutoIt腳本編輯器里輸入如下腳本,綠色部分為解釋的,不需要寫。

6)編譯成一個.exe文件
先保存到本地,例如默認(rèn)路徑保存,名稱為UploadFile.au3,然后在AutoIt腳本編輯器中點(diǎn)擊Tools菜單,選擇compile,會在同路徑下生成一個UploadFile.exe的文件,待會在Selenium腳本要使用。

7)Selenium腳本執(zhí)行UploadFile.exe文件,觀察文件是否上傳。
package first;
import java.util.concurrent.TimeUnit;
import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.firefox.FirefoxDriver;
public class AutoIt {
public static void main(String[] args) throws Exception{
WebDriver driver=new FirefoxDriver();
driver.manage().window().maximize();
driver.manage().timeouts().implicitlyWait(4, TimeUnit.SECONDS);
driver.get("http://www.baidu.com");
//點(diǎn)擊照相機(jī)這個工具
driver.findElement(By.xpath("http://*/span[@class='soutu-btn']")).click();
//點(diǎn)擊本地上傳圖片
driver.findElement(By.xpath("http://*/div[@class='upload-wrap']")).click();
// 執(zhí)行桌面的AutoIt封裝的腳本
Runtime.getRuntime().exec("C:\\Users\\你的用戶名\\Desktop\\UploadFile.exe");
}
}
我用的是火狐62,最終的效果如圖所示:

Selenium文集傳送門:
| 標(biāo)題 | 簡介 |
|---|---|
| Python爬蟲 - Selenium(1)安裝和簡單使用 | 詳細(xì)介紹Selenium的依賴環(huán)境在Windows和Centos7上的安裝及簡單使用 |
| Python爬蟲 - Selenium(2)元素定位和WebDriver常用方法 | 詳細(xì)介紹定位元素的8種方式并配合點(diǎn)擊和輸入、提交、獲取斷言信息等方法的使用 |
| Python爬蟲 - Selenium(3)控制瀏覽器的常用方法 | 詳細(xì)介紹自定義瀏覽器窗口大小或全屏、控制瀏覽器后退、前進(jìn)、刷新瀏覽器等方法的使用 |
| Python爬蟲 - Selenium(4)配置啟動項參數(shù) | 詳細(xì)介紹Selenium啟動項參數(shù)的配置,其中包括無界面模式、瀏覽器窗口大小設(shè)置、瀏覽器User-Agent (請求頭)等等 |
| Python爬蟲 - Selenium(5)鼠標(biāo)事件 | 詳細(xì)介紹鼠標(biāo)右擊、雙擊、拖動、鼠標(biāo)懸停等方法的使用 |
| Python爬蟲 - Selenium(6)鍵盤事件 | 詳細(xì)介紹鍵盤的操作,幾乎包含所有常用按鍵以及組合鍵 |
| Python爬蟲 - Selenium(7)多窗口切換 | 詳細(xì)介紹Selenium是如何實(shí)現(xiàn)在不同的窗口之間自由切換 |
| Python爬蟲 - Selenium(8)frame/iframe表單嵌套頁面 | 詳細(xì)介紹如何從當(dāng)前定位的主體切換為frame/iframe表單的內(nèi)嵌頁面中 |
| Python爬蟲 - Selenium(9)警告框(彈窗)處理 | 詳細(xì)介紹如何定位并處理多類警告彈窗 |
| Python爬蟲 - Selenium(10)下拉框處理 | 詳細(xì)介紹如何靈活的定位并處理下拉框 |
| Python爬蟲 - Selenium(11)文件上傳 | 詳細(xì)介紹如何優(yōu)雅的通過send_keys()指定文件進(jìn)行上傳 |
| Python爬蟲 - Selenium(12)獲取登錄Cookies,并添加Cookies自動登錄 | 詳細(xì)介紹如何獲取Cookies和使用Cookies進(jìn)行自動登錄 |
| Python爬蟲 - Selenium(13)設(shè)置元素等待 | 詳細(xì)介紹如何優(yōu)雅的設(shè)置元素等待時間,防止程序運(yùn)行過快而導(dǎo)致元素定位失敗 |
| Python爬蟲 - Selenium(14)窗口截圖 | 詳細(xì)介紹如何使用窗口截圖 |
| Python爬蟲 - Selenium(15)關(guān)閉瀏覽器 | 詳細(xì)介紹兩種關(guān)閉窗口的區(qū)別 |
到此這篇關(guān)于Python爬蟲中Selenium實(shí)現(xiàn)文件上傳的文章就介紹到這了,更多相關(guān)Selenium 文件上傳內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python SELENIUM上傳文件或圖片實(shí)現(xiàn)過程
- Selenium瀏覽器自動化如何上傳文件
- selenium+python實(shí)現(xiàn)文件上傳操作的方法實(shí)例
- Python selenium文件上傳下載功能代碼實(shí)例
- 基于python的selenium兩種文件上傳操作實(shí)現(xiàn)詳解
- python+selenium+autoit實(shí)現(xiàn)文件上傳功能
- Python中selenium實(shí)現(xiàn)文件上傳所有方法整理總結(jié)
- Python selenium文件上傳方法匯總
- Python中Selenium上傳文件的幾種方式
相關(guān)文章
Python的標(biāo)準(zhǔn)模塊包json詳解
這篇文章主要介紹了Python的標(biāo)準(zhǔn)模塊包json詳解的相關(guān)資料,需要的朋友可以參考下2017-03-03
OpenCV-Python實(shí)現(xiàn)多模板匹配
模板匹配就是在一幅圖像中尋找另一幅模板圖像最匹配,本文主要實(shí)現(xiàn)了多模板匹配,具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-06-06
使用Python防止SQL注入攻擊的實(shí)現(xiàn)示例
這篇文章主要介紹了使用Python防止SQL注入攻擊的實(shí)現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-05-05
python實(shí)現(xiàn)微信接口(itchat)詳細(xì)介紹
這篇文章主要介紹了python實(shí)現(xiàn)微信接口(itchat)詳細(xì)介紹,小編覺得挺不錯的,這里分享給大家,供需要的朋友參考。2017-10-10

