python爬取全國(guó)火鍋店數(shù)量并可視化展示
前言:
今天教大家如何獲取全國(guó)不同城市火鍋店數(shù)量情況,并將這些數(shù)據(jù)進(jìn)行可視化展示,以更加直觀的方式去瀏覽全國(guó)不同省份、不同城市的火鍋店分布情況。
本文數(shù)據(jù)來(lái)自于某度地圖,通過(guò)python技術(shù)知識(shí)去獲取數(shù)據(jù)并進(jìn)行可視化。
一、網(wǎng)頁(yè)分析
首先先看一下數(shù)據(jù)源,在某度地圖里面按照下方操作,就可以請(qǐng)求到全國(guó)的火鍋店情況(從下圖來(lái)看沒(méi)有顯示出來(lái),但是通過(guò)Network,可以看到數(shù)據(jù))
再network中,找到下面這個(gè)數(shù)據(jù)包:
打開(kāi)之后可以看到j(luò)son數(shù)據(jù):
二、獲取數(shù)據(jù)
對(duì)網(wǎng)頁(yè)分析好之后,接下來(lái)可以借助Python技術(shù)進(jìn)行獲取數(shù)據(jù),并保存到excel中。
1.導(dǎo)入相關(guān)庫(kù)
import json import requests import openpyxl
2.請(qǐng)求數(shù)據(jù)
下面開(kāi)始編寫請(qǐng)求數(shù)據(jù)代碼(請(qǐng)求時(shí)記得帶上headers)
###請(qǐng)求頭 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36", 'Referer':'https://map.baidu.com/@12949550.923158279,3712445.9716704674,6.28z', "Cookie":";"你的cookie", } ##請(qǐng)求鏈接 url = "https://map.baidu.com/?newmap=1&reqflag=pcmap&biz=1&from=webmap&da_par=direct&pcevaname=pc4.1&qt=s&da_src=searchBox.button&wd=%E7%81%AB%E9%94%85%E5%BA%97&c=1&src=0&wd2=&pn=0&sug=0&l=6&b=(10637065.476146251,2368134.592189369;12772445.910805061,5056757.351151566)&from=webmap&biz_forward={%22scaler%22:1,%22styles%22:%22pl%22}&sug_forward=&auth=NTSwAZUMzIaTTdWD4WAv0731cWF3MQEauxLxREHzERRtykiOxAXXw1GgvPUDZYOYIZuVt1cv3uVtGccZcuVtPWv3GuztQZ3wWvUvhgMZSguxzBEHLNRTVtcEWe1GD8zv7ucvY1SGpuxVthgW1aDeuxtf0wd0vyMySFIAFM7ueh33uTtAffbDF&seckey=c6d9c7e05d7e627c56ed46fab5d7c5c792064779599d5e12b955a6f18a1204375d1588206c94d22e4bdd1ade0ad06e78c21917e24c6223b96bc51b75ca38651a1b203a0609f126163c5e82fd0549a068e537303424837ab798acfc9088e5d76a66451c20ebd9599b41c9b4f1371850d20fa442ad464712f54c912422f4fa20b3052f8bb810f30d41c7c0e55af68f9d9d973537f03d0aa0a1d1617d78cae29b49c64c2d2dc3f44cf0f8799234b124a7a2dec18bfa011e097e31a508eae37b8603f97df8f935f04b3652f190eac52d04816f302a582c53971e515ff2e0e2b4cc30446e0bee48d51c4be8b6fe4185589ed9&device_ratio=1&tn=B_NORMAL_MAP&nn=0&u_loc=12677548,2604239&ie=utf-8&t=1618452491622" ###響應(yīng)數(shù)據(jù) response = requests.get(url,headers=headers).json()
這里的cookie可以在瀏覽器network中復(fù)制即可。
通過(guò)返回的json數(shù)據(jù)可知道,我們的目標(biāo)數(shù)據(jù)在more_city中,里面是列表數(shù)據(jù)是省份(provice是省份名稱,num是火鍋店數(shù)量),緊接著每一個(gè)省份里都有city(列表),里面是對(duì)應(yīng)著省份的城市(name是城市名稱,num是對(duì)應(yīng)城市火鍋店數(shù)量)
response = response['more_city'] for i in response: city = i['city'] print(i['province']) print(i['num']) for j in city: print(j['name']) print(j['num'])
3.保存到excel
省份和城市分別保存到兩個(gè)不同的excel中
outwb_p = openpyxl.Workbook() outws_p = outwb_p.create_sheet(index=0) outws_p.cell(row=1, column=1, value="省份") outws_p.cell(row=1, column=2, value="數(shù)量") outwb_c = openpyxl.Workbook() outws_c = outwb_c.create_sheet(index=0) outws_c.cell(row=1, column=1, value="城市") outws_c.cell(row=1, column=2, value="數(shù)量") ################## ###在循環(huán)中寫入數(shù)據(jù) ################## ### 保存全國(guó)省份火鍋數(shù)量-李運(yùn)辰” outwb_p.save("全國(guó)省份火鍋數(shù)量-李運(yùn)辰.xls") # 保存 ### 保存全國(guó)城市火鍋數(shù)量-李運(yùn)辰” outwb_c.save("全國(guó)城市火鍋數(shù)量-李運(yùn)辰.xls") # 保存
三、數(shù)據(jù)可視化
1.全國(guó)火鍋店數(shù)量分布
datafile = u'全國(guó)省份火鍋數(shù)量-李運(yùn)辰.xls' data = pd.read_excel(datafile) attr = data['省份'].tolist() value = data['數(shù)量'].tolist() name = [] for i in attr: if "省" in i: name.append(i.replace("省","")) else: name.append(i) from pyecharts import options as opts from pyecharts.charts import Map from pyecharts.faker import Faker c = ( Map() .add("數(shù)量", [list(z) for z in zip(name, value)], "china") .set_global_opts(title_opts=opts.TitleOpts(title="全國(guó)火鍋店數(shù)量分布情況")) .render("全國(guó)火鍋店數(shù)量分布情況.html") )
還可以這樣畫(huà):
datafile = u'全國(guó)省份火鍋數(shù)量-李運(yùn)辰.xls' df = pd.read_excel(datafile) province_distribution = df[['省份', '數(shù)量']].values.tolist() geo = Geo() geo.set_series_opts(label_opts=opts.LabelOpts(is_show=False)) geo.add_schema(maptype="china") geo.set_global_opts(visualmap_opts=opts.VisualMapOpts(max_=110000)) # 加入數(shù)據(jù) geo.add('全國(guó)火鍋店數(shù)量分布情況圖2', province_distribution, type_=ChartType.EFFECT_SCATTER) geo.render("全國(guó)火鍋店數(shù)量分布情況圖2.html")
2.四川火鍋店數(shù)量分布
為了繪制城市的分布圖,選擇了四川省為例進(jìn)行繪制(如果要繪制全國(guó)的所有城市,那樣出來(lái)的圖密密麻麻,不美觀)
datafile = u'全國(guó)城市火鍋數(shù)量-李運(yùn)辰.xls' data = pd.read_excel(datafile) city = data['城市'].tolist() values2 = data['數(shù)量'].tolist() ###四川 name = [] value = [] flag = 0 for i in range(0,len(city)): if city[i] =="綿陽(yáng)市": flag = 1 if flag: name.append(city[i]) value.append(int(values2[i])) if city[i] =="甘孜藏族自治州": name.append(city[i]) value.append(int(values2[i])) break c = ( Map() .add("四川火鍋店數(shù)量分布", [list(z) for z in zip(name, value)], "四川") .set_global_opts( title_opts=opts.TitleOpts(title="四川火鍋店數(shù)量分布"), visualmap_opts=opts.VisualMapOpts() ) .render("四川火鍋店數(shù)量分布.html") )
四、小結(jié)
到此這篇關(guān)于python爬取全國(guó)火鍋店數(shù)量并可視化展示的文章就介紹到這了,更多相關(guān)python可視化內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
總結(jié)Python變量的相關(guān)知識(shí)
今天給大家?guī)?lái)的是關(guān)于Python基礎(chǔ)的相關(guān)知識(shí),文章圍繞著Python變量的相關(guān)知識(shí)展開(kāi),文中有非常詳細(xì)的介紹及代碼示例,需要的朋友可以參考下2021-06-06Python 腳本實(shí)現(xiàn)淘寶準(zhǔn)點(diǎn)秒殺功能
這篇文章主要介紹了python實(shí)現(xiàn)淘寶準(zhǔn)點(diǎn)秒殺腳本,本文圖文實(shí)例相結(jié)合給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-11-11python 判斷文件還是文件夾的簡(jiǎn)單實(shí)例
今天小編就為大家分享一篇python 判斷文件還是文件夾的簡(jiǎn)單實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-06-06總結(jié)Python編程中函數(shù)的使用要點(diǎn)
這篇文章主要介紹了Python編程中函數(shù)的使用要點(diǎn)總結(jié),文中也講到了人民群眾喜聞樂(lè)見(jiàn)的lambda表達(dá)式的用法,需要的朋友可以參考下2016-03-03如何將自己的python庫(kù)打包成wheel文件并上傳到pypi
這篇文章主要介紹了如何將自己的python庫(kù)打包成wheel文件并上傳到pypi,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04