python抓取京東小米8手機配置信息
更新時間:2018年11月13日 15:39:34 作者:謝公子
這篇文章主要為大家詳細介紹了python抓取京東手機配置信息,具有一定的參考價值,感興趣的小伙伴們可以參考一下
本文代碼是使用python抓取京東小米8手機的配置信息
首先找到小米8商品的鏈接:https://item.jd.com/7437788.html
然后找到其配置信息的標簽,我們找到其配置信息的標簽為 <div class="Ptable">

然后再分析其配置信息的頁面的規(guī)律,我們發(fā)現都是dl中包含了dt和dd,而一個dt對應的一個dd,dt對應的是參數,dd對應的是參數具體的值

下面是源代碼
import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的標簽
data=DataFrame(columns=["參數","值"]) #定義一個二元的DataFrame
dls=divSoup.find_all("dl")
for dl in dls:
dts=dl.find_all("dt")
dds=dl.find_all("dd")
if len(dts)==len(dds):
for i in range(len(dts)):
f=dts[i].getText();
p=dds[i].getText();
data=data.append(Series([f,p],index=["參數","值"]),ignore_index=True);
print(data)
這是最終抓取到的配置信息,一共有64行,這里我就不一一列舉出來了

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

