python爬蟲(chóng)selenium模塊詳解
selenium模塊
selenium基本概念
selenium優(yōu)勢(shì)
- 便捷的獲取網(wǎng)站中動(dòng)態(tài)加載的數(shù)據(jù)
- 便捷實(shí)現(xiàn)模擬登陸
selenium使用流程:
1.環(huán)境安裝:pip install selenium
2.下載一個(gè)瀏覽器的驅(qū)動(dòng)程序(谷歌瀏覽器)
3.實(shí)例化一個(gè)瀏覽器對(duì)象
基本使用
代碼
from selenium import webdriver from lxml import etree from time import sleep if __name__ == '__main__': bro = webdriver.Chrome(r"E:\google\Chrome\Application\chromedriver.exe") bro.get(url='http://scxk.nmpa.gov.cn:81/xk/') page_text = bro.page_source tree = etree.HTML(page_text) li_list = tree.xpath('//*[@id="gzlist"]/li') for li in li_list: name = li.xpath('./dl/@title')[0] print(name) sleep(5) bro.quit()
基于瀏覽器自動(dòng)化的操作
代碼
#編寫(xiě)基于瀏覽器自動(dòng)化的操作代碼 - 發(fā)起請(qǐng)求: get(url) - 標(biāo)簽定位: find系列的方法 - 標(biāo)簽交互: send_ keys( 'xxx' ) - 執(zhí)行js程序: excute_script('jsCod') - 前進(jìn),后退: back(),forward( ) - 關(guān)閉瀏覽器: quit()
代碼
https://www.taobao.com/
from selenium import webdriver from time import sleep bro = webdriver.Chrome(executable_path=r"E:\google\Chrome\Application\chromedriver.exe") bro.get(url='https://www.taobao.com/') #標(biāo)簽定位 search_input = bro.find_element_by_id('q') sleep(2) #執(zhí)行一組js代碼,使得滾輪向下滑動(dòng) bro.execute_script('window.scrollTo(0,document.body.scrollHeight)') sleep(2) #標(biāo)簽交互 search_input.send_keys('女裝') button = bro.find_element_by_class_name('btn-search') button.click() bro.get('https://www.baidu.com') sleep(2) bro.back() sleep(2) bro.forward() sleep(5) bro.quit()
selenium處理iframe:
- 如果定位的標(biāo)簽存在于iframe標(biāo)簽之中,則必須使用switch_to.frame(id) - 動(dòng)作鏈(拖動(dòng)) : from selenium. webdriver import ActionChains - 實(shí)例化一個(gè)動(dòng)作鏈對(duì)象: action = ActionChains (bro) - click_and_hold(div) :長(zhǎng)按且點(diǎn)擊操作 - move_by_offset(x,y) - perform( )讓動(dòng)作鏈立即執(zhí)行 - action.release( )釋放動(dòng)作鏈對(duì)象
代碼
https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable
from selenium import webdriver from time import sleep from selenium.webdriver import ActionChains bro = webdriver.Chrome(executable_path=r"E:\google\Chrome\Application\chromedriver.exe") bro.get('https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable') bro.switch_to.frame('iframeResult') div = bro.find_element_by_id('draggable') #動(dòng)作鏈 action = ActionChains(bro) action.click_and_hold(div) for i in range(5): action.move_by_offset(17,0).perform() sleep(0.3) #釋放動(dòng)作鏈 action.release() bro.quit()
selenium模擬登陸QQ空間
代碼
https://qzone.qq.com/
from selenium import webdriver from time import sleep bro = webdriver.Chrome(executable_path=r"E:\google\Chrome\Application\chromedriver.exe") bro.get('https://qzone.qq.com/') bro.switch_to.frame("login_frame") switcher = bro.find_element_by_id('switcher_plogin') switcher.click() user_tag = bro.find_element_by_id('u') password_tag = bro.find_element_by_id('p') user_tag.send_keys('1234455') password_tag.send_keys('qwer123') sleep(1) but = bro.find_element_by_id('login_button') but.click()
無(wú)頭瀏覽器和規(guī)避檢測(cè)
代碼
from selenium import webdriver from time import sleep #實(shí)現(xiàn)無(wú)可視化界面 from selenium.webdriver.chrome.options import Options #實(shí)現(xiàn)規(guī)避檢測(cè) from selenium.webdriver import ChromeOptions #實(shí)現(xiàn)無(wú)可視化界面 chrome_options = Options() chrome_options.add_argument('--headless') chrome_options.add_argument('--disable-gpu') #實(shí)現(xiàn)規(guī)避檢測(cè) option = ChromeOptions() option.add_experimental_option('excludeSwitches',['enable-automation']) bro = webdriver.Chrome(executable_path=r"E:\google\Chrome\Application\chromedriver.exe",chrome_options=chrome_options,options=option) bro.get('https://www.baidu.com') print(bro.page_source) sleep(2) bro.quit()
到此這篇關(guān)于python爬蟲(chóng)selenium模塊詳解的文章就介紹到這了,更多相關(guān)python爬蟲(chóng)selenium模塊內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python爬蟲(chóng)之利用selenium模塊自動(dòng)登錄CSDN
- python爬蟲(chóng)開(kāi)發(fā)之selenium模塊詳細(xì)使用方法與實(shí)例全解
- Python中Selenium模塊的使用詳解
- Python Selenium模塊安裝使用教程詳解
- Python selenium模塊實(shí)現(xiàn)定位過(guò)程解析
- Python使用Selenium模塊模擬瀏覽器抓取斗魚(yú)直播間信息示例
- Python使用Selenium模塊實(shí)現(xiàn)模擬瀏覽器抓取淘寶商品美食信息功能示例
- python爬蟲(chóng)之selenium模塊
相關(guān)文章
簡(jiǎn)單講解Python中的字符串與字符串的輸入輸出
這篇文章主要介紹了Python中的字符串與字符串的輸入輸出,Python3.x版本中默認(rèn)以Unicode為編碼,省去了不少麻煩,需要的朋友可以參考下2016-03-03python使用__slots__讓你的代碼更加節(jié)省內(nèi)存
如果要限制添加的屬性,例如,Student類(lèi)只允許添加 name、gender和score 這3個(gè)屬性,就可以利用Python的一個(gè)特殊的slots來(lái)實(shí)現(xiàn)。這篇文章主要給大家介紹了關(guān)于python如何使用__slots__讓你的代碼更加節(jié)省內(nèi)存的相關(guān)資料,需要的朋友可以參考下2018-09-09python在openstreetmap地圖上繪制路線圖的實(shí)現(xiàn)
這篇文章主要介紹了python在openstreetmap地圖上繪制路線圖的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07Pyqt5實(shí)現(xiàn)英文學(xué)習(xí)詞典
這篇文章主要為大家詳細(xì)介紹了Pyqt5實(shí)現(xiàn)英文學(xué)習(xí)詞典的相關(guān)方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-06-06一篇文章帶你了解python標(biāo)準(zhǔn)庫(kù)--os模塊
在本篇內(nèi)容里小編給大家整理的是關(guān)于Python中os模塊及用法相關(guān)知識(shí)點(diǎn),有興趣的朋友們可以學(xué)習(xí)下,希望能給你帶來(lái)幫助2021-08-08深入解析神經(jīng)網(wǎng)絡(luò)從原理到實(shí)現(xiàn)
這篇文章主要介紹了深入解析神經(jīng)網(wǎng)絡(luò)從原理到實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07scrapy redis配置文件setting參數(shù)詳解
這篇文章主要介紹了scrapy redis配置文件setting參數(shù)詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11