python抓取京東小米8手機(jī)配置信息
本文代碼是使用python抓取京東小米8手機(jī)的配置信息
首先找到小米8商品的鏈接:https://item.jd.com/7437788.html
然后找到其配置信息的標(biāo)簽,我們找到其配置信息的標(biāo)簽為 <div class="Ptable">
然后再分析其配置信息的頁(yè)面的規(guī)律,我們發(fā)現(xiàn)都是dl中包含了dt和dd,而一個(gè)dt對(duì)應(yīng)的一個(gè)dd,dt對(duì)應(yīng)的是參數(shù),dd對(duì)應(yīng)的是參數(shù)具體的值
下面是源代碼
import requests from bs4 import BeautifulSoup from pandas import Series from pandas import DataFrame response=requests.get("https://item.jd.com/7437788.html") html=response.text soup=BeautifulSoup(html,"html.parser") divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的標(biāo)簽 data=DataFrame(columns=["參數(shù)","值"]) #定義一個(gè)二元的DataFrame dls=divSoup.find_all("dl") for dl in dls: dts=dl.find_all("dt") dds=dl.find_all("dd") if len(dts)==len(dds): for i in range(len(dts)): f=dts[i].getText(); p=dds[i].getText(); data=data.append(Series([f,p],index=["參數(shù)","值"]),ignore_index=True); print(data)
這是最終抓取到的配置信息,一共有64行,這里我就不一一列舉出來(lái)了
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
對(duì)Python Class之間函數(shù)的調(diào)用關(guān)系詳解
今天小編就為大家分享一篇對(duì)Python Class之間函數(shù)的調(diào)用關(guān)系詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01python射線(xiàn)法判斷一個(gè)點(diǎn)在圖形區(qū)域內(nèi)外
這篇文章主要為大家詳細(xì)介紹了python射線(xiàn)法判斷一個(gè)點(diǎn)在圖形區(qū)域內(nèi)外,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-06-06python小練習(xí)之爬魷魚(yú)游戲的評(píng)價(jià)生成詞云
讀萬(wàn)卷書(shū)不如行萬(wàn)里路,只學(xué)書(shū)上的理論是遠(yuǎn)遠(yuǎn)不夠的,只有在實(shí)戰(zhàn)中才能獲得能力的提升,本篇文章手把手帶你用Python爬取熱火的魷魚(yú)游戲評(píng)價(jià),大家可以在過(guò)程中查缺補(bǔ)漏,提升水平2021-10-10pytorch的backward()的底層實(shí)現(xiàn)邏輯詳解
自動(dòng)微分是一種計(jì)算張量(tensors)的梯度(gradients)的技術(shù),它在深度學(xué)習(xí)中非常有用,這篇文章主要介紹了pytorch的backward()的底層實(shí)現(xiàn)邏輯,需要的朋友可以參考下2023-11-11Python實(shí)現(xiàn)對(duì)字符串中字符提取校驗(yàn)
眾所周知,python之所以很方便在一定程度上是因?yàn)殡S時(shí)都可能有人又創(chuàng)作了一個(gè)好用又方便的python非標(biāo)準(zhǔn)庫(kù)。本文就來(lái)用Python實(shí)現(xiàn)對(duì)字符串中字符進(jìn)行提取校驗(yàn),需要的可以參考一下2022-10-10