亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python爬蟲(chóng)基礎(chǔ)初探selenium

 更新時(shí)間:2021年05月31日 10:54:05   作者:松鼠愛(ài)吃餅干  
selenium最初是一個(gè)自動(dòng)化測(cè)試工具,而爬蟲(chóng)中使用它主要是為了解決requests無(wú)法執(zhí)行javaScript代碼的問(wèn)題。本文給大家分享Python爬蟲(chóng)基礎(chǔ)selenium知識(shí),包括selenium工作原理,感興趣的朋友跟隨小編一起看看吧

Python爬蟲(chóng)、數(shù)據(jù)分析、網(wǎng)站開(kāi)發(fā)等案例教程視頻免費(fèi)在線觀看

https://space.bilibili.com/523606542

Selenium

Selenium是一個(gè)Web的自動(dòng)化測(cè)試工具,最初是為網(wǎng)站自動(dòng)化測(cè)試而開(kāi)發(fā)的,就像玩游戲用的按鍵精靈,可以按指定的命令自動(dòng)操作。

Selenium測(cè)試工具直接操控瀏覽器中,就像真正的用戶在操作一樣。Selenium可以根據(jù)的指令,讓瀏覽器自動(dòng)加載頁(yè)面,獲取需要的數(shù)據(jù),甚至頁(yè)面截屏,或者判斷網(wǎng)站上某些動(dòng)作是否發(fā)生等。

selenium的用途

 ?。?)、selenium可以驅(qū)動(dòng)瀏覽器自動(dòng)執(zhí)行自定義好的邏輯代碼,也就是可以通過(guò)代碼完全模擬成人類使用瀏覽器自動(dòng)訪問(wèn)目標(biāo)站點(diǎn)并操作,那我們也可以拿它來(lái)做爬蟲(chóng)。

 ?。?)、selenium本質(zhì)上是通過(guò)驅(qū)動(dòng)瀏覽器,完全模擬瀏覽器的操作,比如跳轉(zhuǎn)、輸入、點(diǎn)擊、下拉等...進(jìn)而拿到網(wǎng)頁(yè)渲染之后的結(jié)果,可支持多種瀏覽器

selenium是優(yōu)缺點(diǎn)

 ?。?)優(yōu)點(diǎn)
    優(yōu)點(diǎn)就是可以幫我們避開(kāi)一系列復(fù)雜的通信流程,例如在我們之前學(xué)習(xí)的requests模塊,那么requests模塊在模擬請(qǐng)求的時(shí)候是不是需要把素有的通信流程都分析完成后才能通過(guò)請(qǐng)求,然后返回響應(yīng)。假如目標(biāo)站點(diǎn)有一系列復(fù)雜的通信流程,例如的登錄時(shí)的滑動(dòng)驗(yàn)證等...那么你使用requests模塊的時(shí)候是不是就特別麻煩了。不過(guò)你也不需要擔(dān)心,因?yàn)榫W(wǎng)站的反爬策略越高,那么用戶的體驗(yàn)效果就越差,所以網(wǎng)站都需要在用戶的淫威之下降低安全策略。
    再看一點(diǎn)requests請(qǐng)求庫(kù)能不能執(zhí)行js?是不是不能呀!那么如果你的網(wǎng)站需要發(fā)送ajax請(qǐng)求,異步獲取數(shù)據(jù)渲染到頁(yè)面上,是不是就需要使用js發(fā)送請(qǐng)求了。那瀏覽器的特點(diǎn)是什么?是不是可以直接訪問(wèn)目標(biāo)站點(diǎn),然后獲取對(duì)方的數(shù)據(jù),從而渲染到頁(yè)面上。那這些就是使用selenium的好處!
 ?。?)缺點(diǎn)
    使用selenium本質(zhì)上是驅(qū)動(dòng)瀏覽器對(duì)目標(biāo)站點(diǎn)發(fā)送請(qǐng)求,那瀏覽器在訪問(wèn)目標(biāo)站點(diǎn)的時(shí)候,是不是都需要把靜態(tài)資源都加載完畢。html、css、js這些文件是不是都要等待它加載完成。是不是速度特別慢。那用它的壞處就是效率極低!所以我們一般用它來(lái)做登錄驗(yàn)證。

1. Selenium工作原理

Python爬蟲(chóng)基礎(chǔ)講解:初探selenium


 

如圖所示,通過(guò)Python來(lái)控制Selenium,然后讓Selenium 控制瀏覽器,操縱瀏覽器,這樣就實(shí)現(xiàn)了使用Python間接的操控瀏覽器。

1.1 Selenium配置

Selenium支持多種瀏覽器,最常見(jiàn)的就是火狐和谷歌瀏覽器。首先在電腦上下載瀏覽器,瀏覽器版本不宜過(guò)新。

火狐:截圖如下

Python爬蟲(chóng)基礎(chǔ)講解:初探selenium

谷歌:截圖如下

Python爬蟲(chóng)基礎(chǔ)講解:初探selenium

1.2 瀏覽器驅(qū)動(dòng)

Selenium具體怎么就能操縱瀏覽器呢?這要?dú)w功于瀏覽器驅(qū)動(dòng),Selenium可以通過(guò)API接口實(shí)現(xiàn)和瀏覽器驅(qū)動(dòng)的交互,進(jìn)而實(shí)現(xiàn)和瀏覽器的交互。所以要配置瀏覽器驅(qū)動(dòng)。

火狐驅(qū)動(dòng)下載地址:
http://npm.taobao.org/mirrors/geckodriver/
谷歌驅(qū)動(dòng)下載地址:
https://npm.taobao.org/mirrors/chromedriver/

配置瀏覽器驅(qū)動(dòng):

將下載好的瀏覽器驅(qū)動(dòng)解壓,將解壓出的exe文件放到Python的安裝目錄下,也就是和python.exe同目錄即可。

Python爬蟲(chóng)基礎(chǔ)講解:初探selenium

1.3 使用Selenium

安裝selenium模塊,python借助這個(gè)模塊驅(qū)動(dòng)瀏覽器,使用如下命令行安裝這個(gè)模塊即可

pip install selenium

2 快速入門

# 打開(kāi)百度首頁(yè)
 
from selenium import webdriver
 
driver = webdriver.chrome()
url = 'https : / /www.baidu . com/ '
driver.get(url)
#打開(kāi)get就類似與在瀏覽器地址欄里面放入網(wǎng)址
driver.get(url)
#退出瀏覽器
driver.quit()

以上就是Python爬蟲(chóng)基礎(chǔ)初探selenium的詳細(xì)內(nèi)容,更多關(guān)于Python爬蟲(chóng)基礎(chǔ)selenium的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Python AutoCAD 系統(tǒng)設(shè)置的實(shí)現(xiàn)方法

    Python AutoCAD 系統(tǒng)設(shè)置的實(shí)現(xiàn)方法

    這篇文章主要介紹了Python AutoCAD 系統(tǒng)設(shè)置的實(shí)現(xiàn)方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-04-04
  • Python字符串拼接的幾種方法整理

    Python字符串拼接的幾種方法整理

    這篇文章主要介紹了Python字符串拼接的幾種方法整理的相關(guān)資料,這里提供了五種方法及實(shí)現(xiàn),需要的朋友可以參考下
    2017-08-08
  • python?管理系統(tǒng)實(shí)現(xiàn)mysql交互的示例代碼

    python?管理系統(tǒng)實(shí)現(xiàn)mysql交互的示例代碼

    這篇文章主要介紹了python?管理系統(tǒng)實(shí)現(xiàn)mysql交互,本文通過(guò)實(shí)例代碼圖文相結(jié)合給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-12-12
  • Python tkinter實(shí)現(xiàn)的圖片移動(dòng)碰撞動(dòng)畫效果【附源碼下載】

    Python tkinter實(shí)現(xiàn)的圖片移動(dòng)碰撞動(dòng)畫效果【附源碼下載】

    這篇文章主要介紹了Python tkinter實(shí)現(xiàn)的圖片移動(dòng)碰撞動(dòng)畫效果,涉及Python tkinter模塊操作圖片基于坐標(biāo)動(dòng)態(tài)變換與數(shù)值判定實(shí)現(xiàn)移動(dòng)、碰撞檢測(cè)等相關(guān)操作技巧,需要的朋友可以參考下
    2018-01-01
  • django時(shí)區(qū)問(wèn)題的解決

    django時(shí)區(qū)問(wèn)題的解決

    我們都知道時(shí)區(qū),標(biāo)準(zhǔn)時(shí)區(qū)是UTC時(shí)區(qū),django默認(rèn)使用的就是UTC時(shí)區(qū),我們希望存儲(chǔ)在數(shù)據(jù)庫(kù)中的時(shí)間就是本地時(shí)間(東八區(qū)的時(shí)間),那么應(yīng)該怎么設(shè)置,就一起來(lái)了解一下
    2021-05-05
  • 基于python的文字轉(zhuǎn)圖片工具示例詳解

    基于python的文字轉(zhuǎn)圖片工具示例詳解

    這篇文章主要介紹了基于python的文字轉(zhuǎn)圖片工具,請(qǐng)求示例是使用?curl?命令請(qǐng)求示例,本文給大家介紹的非常詳細(xì),感興趣的朋友跟隨小編一起看看吧
    2024-08-08
  • Python中命名元組Namedtuple的使用詳解

    Python中命名元組Namedtuple的使用詳解

    Python支持一種名為“namedtuple()”的容器字典,它存在于模塊“collections”中,下面就跟隨小編一起學(xué)習(xí)一下Namedtuple的具體使用吧
    2023-09-09
  • 使用python實(shí)現(xiàn)將excel數(shù)據(jù)導(dǎo)入word并設(shè)置字體樣式的代碼示例

    使用python實(shí)現(xiàn)將excel數(shù)據(jù)導(dǎo)入word并設(shè)置字體樣式的代碼示例

    在日常辦公和數(shù)據(jù)處理中,我們經(jīng)常需要將Excel中的數(shù)據(jù)導(dǎo)入到Word文檔中,手動(dòng)完成這個(gè)過(guò)程可能既費(fèi)時(shí)又容易出錯(cuò),本文將介紹如何使用Python自動(dòng)化這一任務(wù),需要的朋友可以參考下
    2024-02-02
  • 最新評(píng)論