python 淘寶爬蟲小實(shí)例
兄弟們,雙十一剁手了嗎?購(gòu)物雖快樂(lè),但是別過(guò)度了,畢竟很多降價(jià)不是真的降價(jià),眼睛擦亮了~
今天來(lái)試試爬一下某寶,這玩意學(xué)會(huì)了做外包的話,還是值幾個(gè)錢的。
環(huán)境/模塊介紹
python 3.8 使用的環(huán)境
pycharm 使用的編輯器
selenium 瀏覽器驅(qū)動(dòng)的第三方模塊
csv 數(shù)據(jù)保存的模塊
time 時(shí)間模塊, 可以用于程序的延遲
random 隨機(jī)數(shù)模塊
下載操作瀏覽器驅(qū)動(dòng)的第三方模塊
對(duì)應(yīng)視頻教程:
Python:雙十火熱進(jìn)行中,教你帶你用Python繼續(xù)剁手
selenium pip install selenium
解釋我基本都寫在注釋了,我就偷個(gè)懶不在寫了。
from selenium import webdriver import time # 時(shí)間模塊, 可以用于程序的延遲 import random # 隨機(jī)數(shù)模塊 from constants import TAO_USERNAME1, TAO_PASSWORD1 import csv # 數(shù)據(jù)保存的模塊 def search_product(keyword): """搜索商品數(shù)據(jù), 登錄用戶""" driver.find_element_by_xpath('//*[@id="q"]').send_keys(keyword) time.sleep(random.randint(1, 3)) # 盡量避免人機(jī)檢測(cè) 隨機(jī)延遲 driver.f def parse_data(): """解析商品數(shù)據(jù)""" divs = driver.find_elements_by_xpath('//div[@class="grid g-clearfx"]/div/div') # 所有的div標(biāo)簽 for div in divs: try: info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text price = div.find_element_by_xpath('.//strong').text + '元' deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text name = div.find_element_by_xpath('.//div[@class="shop"]/a/span[2]').text location = div.find_element_by_xpath('.//div[@class="location"]').te'.//div[@class="pic"]/a').get_attribute('href') print(info, price, deal, name, location, detail_url) # 保存 with open('某寶.csv', mode='a', encoding='utf-8', newline='') as f: csv_write = csv.writer(f) csv_write.writerow([info, price, deal, name, location, detail_url]) except: continue word = input('請(qǐng)輸入你要搜索商品的關(guān)鍵字:') # 創(chuàng)建一個(gè)瀏覽器 driver = webdriver.Chrome() # selenium操作的瀏覽器被識(shí)別了, 無(wú)法登錄 # 修改瀏覽器的部分屬性, 繞過(guò)檢測(cè) driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => false})"""}) # 執(zhí)行自動(dòng)化瀏覽器的操作 driver.get('https://www.taobao.com/') driver.implicitly_wait(10) # 設(shè)置瀏覽器的等待,加載數(shù)據(jù) driver.maximize_window() # 最大化瀏覽器 # 調(diào)用商品搜索的函數(shù) search_product(word) for page in range(100): # 012 print(f'\n==================正在抓取第{page + 1}頁(yè)數(shù)據(jù)====================') url = f'https://s.taobao.com/search?q=%E5%B7%B4%E9%BB%8E%E4%B8%96%E5%AE%B6&s={page * 44}' # 解析商品數(shù)據(jù) parse_data() time.sleep(random.randint(1, 3)) # 盡量避免人機(jī)檢測(cè) 隨機(jī)延遲
兄弟們快去試試吧!Python學(xué)習(xí)視頻,解答,電子書都可以私信我領(lǐng)取
到此這篇關(guān)于python 淘寶爬蟲小實(shí)例的文章就介紹到這了,更多相關(guān)python 淘寶爬蟲內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python實(shí)現(xiàn)接口自動(dòng)化封裝導(dǎo)出excel和讀寫excel數(shù)據(jù)
這篇文章主要為大家詳細(xì)介紹了Python如何實(shí)現(xiàn)接口自動(dòng)化封裝導(dǎo)出excel和讀寫excel數(shù)據(jù),文中的示例代碼簡(jiǎn)潔易懂,希望對(duì)大家有所幫助2023-07-07Python利用PyPDF2庫(kù)處理PDF文件的基本操作
PyPDF2是一個(gè)Python庫(kù),用于處理PDF文件,包括合并、分割、旋轉(zhuǎn)和提取文本等操作,它是一個(gè)功能強(qiáng)大且靈活的工具,可用于自動(dòng)化處理PDF文件,適用于各種應(yīng)用,從文檔管理到數(shù)據(jù)分析,本文將深入介紹PyPDF2庫(kù),掌握如何利用它來(lái)處理PDF文件,需要的朋友可以參考下2023-11-11Pandas的數(shù)據(jù)過(guò)濾實(shí)現(xiàn)
這篇文章主要介紹了Pandas的數(shù)據(jù)過(guò)濾實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01Python面向?qū)ο笾惡蛯?duì)象實(shí)例詳解
這篇文章主要介紹了Python面向?qū)ο笾惡蛯?duì)象,結(jié)合實(shí)例形式詳細(xì)分析了Python面向?qū)ο笙嚓P(guān)的繼承、多態(tài)、類及對(duì)象等概念、原理、操作技巧與注意事項(xiàng),需要的朋友可以參考下2018-12-12使用Python開發(fā)個(gè)京東上搶口罩的小實(shí)例(僅作技術(shù)研究學(xué)習(xí)使用)
這篇文章主要介紹了使用Python開發(fā)個(gè)京東上搶口罩的小實(shí)例(僅作技術(shù)研究學(xué)習(xí)使用),需要的朋友可以參考下2020-03-03python數(shù)據(jù)庫(kù)如何連接SQLite詳解
這篇文章主要介紹了Python實(shí)現(xiàn)連接SQLite數(shù)據(jù)庫(kù)的方法,在Python數(shù)據(jù)庫(kù)編程中有著廣泛的應(yīng)用,需要的朋友可以參考下,希望能給你帶來(lái)幫助2021-08-08python matplotlib模塊基本圖形繪制方法小結(jié)【直線,曲線,直方圖,餅圖等】
這篇文章主要介紹了python matplotlib模塊基本圖形繪制方法,結(jié)合實(shí)例形式總結(jié)分析了Python使用matplotlib模塊繪制直線,曲線,直方圖,餅圖等圖形的相關(guān)操作技巧,需要的朋友可以參考下2020-04-04Python中的xml與dict的轉(zhuǎn)換方法詳解
這篇文章主要介紹了Python中的xml與dict的轉(zhuǎn)換方法詳解,xml 是指可擴(kuò)展標(biāo)記語(yǔ)言,一種標(biāo)記語(yǔ)言類似html,作用是傳輸數(shù)據(jù),而且不是顯示數(shù)據(jù)??梢宰远x標(biāo)簽,需要的朋友可以參考下2023-07-07Python實(shí)現(xiàn)的文軒網(wǎng)爬蟲完整示例
這篇文章主要介紹了Python實(shí)現(xiàn)的文軒網(wǎng)爬蟲,結(jié)合完整實(shí)例形式分析了Python爬蟲爬取文軒網(wǎng)圖書信息的相關(guān)操作技巧,需要的朋友可以參考下2019-05-05