腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

軟件下載

android MAC 驅(qū)動(dòng)下載字體下載 DLL

源碼下載

PHP ASP.NET ASP JSP

軟件編程

C# JAVA C 語(yǔ)言 Delphi Android

網(wǎng)絡(luò)編程

PHP ASP.NET ASP JavaScript

在線工具

CSS格式化 JS格式化 Html轉(zhuǎn)化為Js

數(shù)據(jù)庫(kù)

MYSQL MSSQL oracle DB2 MARIADB

CMS

PHPCMS DEDECMS 帝國(guó)CMS WordPress

常用工具

PHP開(kāi)發(fā)工具 python Photoshop 必備軟件

python 淘寶爬蟲(chóng)小實(shí)例

更新時(shí)間：2021年11月08日 09:11:04 作者：嗨學(xué)編程

雙十一即將到來(lái)，電商都在做活動(dòng)打折，但打完折是不是真的優(yōu)惠了，需要我們自己斟酌，畢竟我們不能一直關(guān)注著價(jià)格，也自然不能知道現(xiàn)在的價(jià)格比以前高了還是低了，今天讓我們用Python來(lái)爬取一下淘寶吧

兄弟們，雙十一剁手了嗎？購(gòu)物雖快樂(lè)，但是別過(guò)度了，畢竟很多降價(jià)不是真的降價(jià)，眼睛擦亮了~

在這里插入圖片描述

今天來(lái)試試爬一下某寶，這玩意學(xué)會(huì)了做外包的話，還是值幾個(gè)錢的。

在這里插入圖片描述

環(huán)境/模塊介紹

python 3.8 使用的環(huán)境
pycharm 使用的編輯器
selenium 瀏覽器驅(qū)動(dòng)的第三方模塊
csv 數(shù)據(jù)保存的模塊
time 時(shí)間模塊, 可以用于程序的延遲
random 隨機(jī)數(shù)模塊

下載操作瀏覽器驅(qū)動(dòng)的第三方模塊
對(duì)應(yīng)視頻教程：

Python：雙十火熱進(jìn)行中，教你帶你用Python繼續(xù)剁手

selenium  pip install selenium

解釋我基本都寫(xiě)在注釋了，我就偷個(gè)懶不在寫(xiě)了。

from selenium import webdriver
import time  # 時(shí)間模塊, 可以用于程序的延遲
import random  # 隨機(jī)數(shù)模塊
from constants import TAO_USERNAME1, TAO_PASSWORD1
import csv  # 數(shù)據(jù)保存的模塊



def search_product(keyword):
    """搜索商品數(shù)據(jù), 登錄用戶"""
    driver.find_element_by_xpath('//*[@id="q"]').send_keys(keyword)
    time.sleep(random.randint(1, 3))  # 盡量避免人機(jī)檢測(cè)  隨機(jī)延遲

    driver.f
def parse_data():
    """解析商品數(shù)據(jù)"""
    divs = driver.find_elements_by_xpath('//div[@class="grid g-clearfx"]/div/div')  #  所有的div標(biāo)簽

    for div in divs:
        try:
            info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text
            price = div.find_element_by_xpath('.//strong').text + '元'
            deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text
            name = div.find_element_by_xpath('.//div[@class="shop"]/a/span[2]').text
            location = div.find_element_by_xpath('.//div[@class="location"]').te'.//div[@class="pic"]/a').get_attribute('href')

            print(info, price, deal, name, location, detail_url)

            # 保存
            with open('某寶.csv', mode='a', encoding='utf-8', newline='') as f:
                csv_write = csv.writer(f)
                csv_write.writerow([info, price, deal, name, location, detail_url])
        except:
            continue


word = input('請(qǐng)輸入你要搜索商品的關(guān)鍵字:')
# 創(chuàng)建一個(gè)瀏覽器
driver = webdriver.Chrome()

# selenium操作的瀏覽器被識(shí)別了, 無(wú)法登錄
# 修改瀏覽器的部分屬性, 繞過(guò)檢測(cè)
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument",
            {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => false})"""})


# 執(zhí)行自動(dòng)化瀏覽器的操作
driver.get('https://www.taobao.com/')
driver.implicitly_wait(10)  # 設(shè)置瀏覽器的等待,加載數(shù)據(jù)
driver.maximize_window()  # 最大化瀏覽器


# 調(diào)用商品搜索的函數(shù)
search_product(word)

for page in range(100): # 012
    print(f'\n==================正在抓取第{page + 1}頁(yè)數(shù)據(jù)====================')
    url = f'https://s.taobao.com/search?q=%E5%B7%B4%E9%BB%8E%E4%B8%96%E5%AE%B6&s={page * 44}'
    # 解析商品數(shù)據(jù)
    parse_data()
    time.sleep(random.randint(1, 3))  # 盡量避免人機(jī)檢測(cè)  隨機(jī)延遲

兄弟們快去試試吧！Python學(xué)習(xí)視頻，解答，電子書(shū)都可以私信我領(lǐng)取

到此這篇關(guān)于python 淘寶爬蟲(chóng)小實(shí)例的文章就介紹到這了,更多相關(guān)python 淘寶爬蟲(chóng)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: