Python?Playwright的使用詳解
實戰(zhàn)場景
本篇博客為大家介紹一款新的自動化測試工具,效果類似 selenium
,但是這個模塊年輕。
模塊名稱為 playwright-python
,微軟開源的,是針對 Python 語言的純自動化工具,可以通過 API 調(diào)用瀏覽器,github 地址在本文末尾。
接下來將通過 3 篇博客為大家詳細(xì)介紹該 playwright-python
,徹徹底底了解它。
正式開始前依舊是模塊安裝:
pip install playwright
該模塊安裝非???,但完整體驗還需要安裝瀏覽器相關(guān)驅(qū)動,這個有點大,命令如下:
python -m playwright install
安裝時注意使用國內(nèi)源!
等待過程中,可以查閱輸出日志,核對安裝了哪些模塊:
Downloading FFMPEG
:FFMPEG;Downloading Firefox 104.0
:火狐瀏覽器驅(qū)動;Downloading Chromium
:谷歌瀏覽器驅(qū)動;Downloading Webkit 16.0
:Webkit 瀏覽器驅(qū)動。
實戰(zhàn)操作
第一次實戰(zhàn)操作,先從不寫代碼開始,通過下述命令啟動瀏覽器,然后【錄制】我們的操作過程。
python -m playwright codegen
運(yùn)行代碼之后,彈出默認(rèn)瀏覽器和一個代碼錄制展示框,具體如下所示:
下面就可以在左側(cè)的瀏覽器窗口中進(jìn)行操作,然后觀察右側(cè)自動生成的代碼段。
在地址欄輸入 baidu.com 跳轉(zhuǎn)到百度首頁,然后輸入 航天員,點擊搜索按鈕,生成的代碼如下所示。
將生成的代碼復(fù)制到開發(fā)工具中,直接運(yùn)行就可以得到剛剛相同的操作。
from playwright.sync_api import Playwright, sync_playwright, expect def run(playwright: Playwright) -> None: browser = playwright.chromium.launch(headless=False) context = browser.new_context() # Open new page page = context.new_page() # Go to https://www.baidu.com/ page.goto("https://www.baidu.com/") # Click input[name="wd"] page.locator("input[name=\"wd\"]").click() # Fill input[name="wd"] page.locator("input[name=\"wd\"]").fill("航天員") # Press Enter page.locator("input[name=\"wd\"]").press("Enter") page.wait_for_url( "https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E8%88%AA%E5%A4%A9%E5%91%98&fenlei=256&rsv_pq=0xfde7decb0011bfe6&rsv_t=3a67vLT%2Buti4VKw0mDppSrydbnq6CGsyOVNNxN%2F39naR6lYvxacuqvbYKRs0&rqlang=en&rsv_enter=1&rsv_dl=tb&rsv_sug3=24&rsv_sug1=24&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&prefixsug=%25E8%2588%25AA%25E5%25A4%25A9%25E5%2591%2598&rsp=5&inputT=5824&rsv_sug4=6786&rsv_jmp=fail") # --------------------- context.close() browser.close() with sync_playwright() as playwright: run(playwright)
接下來我們分析一下其生成的代碼含義。
from playwright.sync_api import Playwright, sync_playwright
從 playwright.sync_api
模塊導(dǎo)入 Playwright
和 sync_playwright
,看到關(guān)鍵字 sync
,可以猜測這是一個同步操作,那與之對應(yīng)的,也是未來我們要對比學(xué)習(xí)的,就是異步接口相關(guān)內(nèi)容,這里先埋下一個伏筆,下篇博客在進(jìn)行討論。
browser = playwright.chromium.launch(headless=False)
初始化一個谷歌瀏覽器對象,并且不是無頭瀏覽器,即在桌面打開瀏覽器窗口。launch()
方法包含很多參數(shù),常用的有以下內(nèi)容:
headless
:是否為無頭瀏覽器,即是否顯示瀏覽器窗口,默認(rèn)為不顯示;channel
:瀏覽器版本,"chrome", "chrome-beta", "chrome-dev", "chrome-canary";proxy
:代理設(shè)置;timeout
:超時時間,默認(rèn) 30s。
context = browser.new_context() page = context.new_page()
打開一個新瀏覽器,創(chuàng)建一個新頁面,其中 browser.new_context()
的參數(shù)都是與瀏覽器配置相關(guān)的內(nèi)容,實踐的時候需要特別設(shè)置的在這里設(shè)置,例如下述參數(shù):
user_agent
:UA 代理;viewport
:頁面大小,比例,例 1024*768;offline
:離線模式加載。
page.goto("https://www.baidu.com/") page.locator("input[name=\"wd\"]").click() …… page.wait_for_url(……)
goto()
:地址跳轉(zhuǎn),即瀏覽器跳轉(zhuǎn);locator()
:定位元素;wait_for_url()
:等待頁面加載完畢。
本文末尾重點介紹一下 goto()
相關(guān)內(nèi)容,剩余函數(shù)下篇博客繼續(xù)說明。 goto()
函數(shù)的重要參數(shù):
url
:跳轉(zhuǎn)地址,必須包含協(xié)議,例如http://
或者https://
;referer
:請求頭中的referer
參數(shù);timeout
:最大操作時間(毫秒),默認(rèn)為 30 秒;wait_until
:默認(rèn)操作成功時,執(zhí)行的內(nèi)容,還有幾個事件,分別是domcontentloaded
,networkidle
,commit
項目開源地址:https://github.com/microsoft/playwright-python
官方手冊:https://playwright.dev/python/docs/intro
到此這篇關(guān)于Python Playwright的使用詳解的文章就介紹到這了,更多相關(guān)Python Playwright內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python設(shè)置windows桌面壁紙的實現(xiàn)代碼
每天換一個壁紙,每天好心情。喜歡的朋友可以參考下2013-01-01解決python3.6用cx_Oracle庫連接Oracle的問題
這篇文章主要介紹了解決python3.6用cx_Oracle庫連接Oracle的問題,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-12-12python使用代理IP爬取貓眼電影專業(yè)評分?jǐn)?shù)據(jù)
在編寫爬蟲程序的過程中,IP封鎖無疑是一個常見且棘手的問題,盡管網(wǎng)絡(luò)上存在大量的免費(fèi)IP代理網(wǎng)站,但其質(zhì)量往往參差不齊,令人堪憂,本篇文章中介紹一下如何使用Python的Requests庫和BeautifulSoup庫來抓取貓眼電影網(wǎng)站上的專業(yè)評分?jǐn)?shù)據(jù),需要的朋友可以參考下2024-03-03