Matplotlib實(shí)戰(zhàn)之折線圖繪制詳解
折線圖是一種用于可視化數(shù)據(jù)變化趨勢(shì)的圖表,它可以用于表示任何數(shù)值隨著時(shí)間或類別的變化。
折線圖由折線段和折線交點(diǎn)組成,折線段表示數(shù)值隨時(shí)間或類別的變化趨勢(shì),折線交點(diǎn)表示數(shù)據(jù)的轉(zhuǎn)折點(diǎn)。
折線圖的方向表示數(shù)據(jù)的變化方向,即正變化還是負(fù)變化,折線的斜率表示數(shù)據(jù)的變化程度。
1. 主要元素
折線圖主要由以下四個(gè)元素組成:
- 數(shù)據(jù)點(diǎn):折線圖中的每個(gè)數(shù)據(jù)點(diǎn)都代表著一個(gè)時(shí)間點(diǎn)或一個(gè)數(shù)值。
- 折線:折線圖中的線條代表著數(shù)據(jù)的變化趨勢(shì)。
- X軸:一般是有序變量,表示數(shù)據(jù)點(diǎn)的變化區(qū)間。
- Y軸:數(shù)據(jù)點(diǎn)在不同時(shí)刻的值。
2. 適用的場(chǎng)景
折線圖適用于以下分析場(chǎng)景:
- 趨勢(shì)分析:折線圖可以用于展示數(shù)據(jù)的增長(zhǎng)、下降、波動(dòng)等趨勢(shì),幫助分析人員了解數(shù)據(jù)的變化趨勢(shì)。
- 問(wèn)題診斷:折線圖可以用于數(shù)據(jù)異常檢測(cè),幫助分析人員快速發(fā)現(xiàn)數(shù)據(jù)的異常情況。
3. 不適用的場(chǎng)景
折線圖不適用于以下分析場(chǎng)景:
- 數(shù)據(jù)分類和分組:折線圖不適用于數(shù)據(jù)分類和分組分析,因?yàn)檎劬€圖主要用于展示數(shù)據(jù)的變化趨勢(shì),而不是數(shù)據(jù)的分類和分組情況。
- 數(shù)據(jù)回歸分析:折線圖不適用于數(shù)據(jù)回歸分析,因?yàn)榛貧w分析需要建立在數(shù)據(jù)樣本中的線性關(guān)系,而折線圖主要用于展示數(shù)據(jù)的變化趨勢(shì),不能很好地反映數(shù)據(jù)的線性關(guān)系。
4. 分析實(shí)戰(zhàn)
4.1. 數(shù)據(jù)來(lái)源
數(shù)據(jù)來(lái)源國(guó)家統(tǒng)計(jì)局公開(kāi)數(shù)據(jù),已經(jīng)整理好的csv文件在:databook.top/nation/A03
本次分析使用其中的 A0301.csv
文件(總?cè)丝跀?shù)據(jù))。
下面的文件路徑 fp
要換成自己實(shí)際的文件路徑。
import pandas as pd fp = "d:/share/A0301.csv" df = pd.read_csv(fp) df
4.2. 數(shù)據(jù)清理
首先看看 zbCN
字段中有多少種不同的人口統(tǒng)計(jì)類別。
df.groupby(by="zbCN").count()
這個(gè)數(shù)據(jù)集中一共有5種不同維度的人口統(tǒng)計(jì):
- 年末總?cè)丝?/li>
- 男性人口
- 女性人口
- 城鎮(zhèn)人口
- 鄉(xiāng)村人口
按照類別,將它們分離成5個(gè)不同的數(shù)據(jù)集,為了繪制折線圖做準(zhǔn)備。
groups = df.groupby(by="zbCN") dict_group = {} for g in groups: dict_group[g[0]] = g[1] for k, v in dict_group.items(): print("key = {}, value type = {}".format(k, type(v)))
groupby
函數(shù)按照 by
參數(shù)指定的字段將數(shù)據(jù)集分組,每個(gè)group
是一個(gè)二元的元組。
第一個(gè)元素是用來(lái)分組的字段值,第二個(gè)元素是分組之后的數(shù)據(jù)集。
4.3. 分析結(jié)果可視化
拆分好數(shù)據(jù)集之后,最就是可視化展示。
首先封裝一個(gè)函數(shù),用來(lái)顯示2個(gè)數(shù)據(jù):(直接使用上面分割好的數(shù)據(jù)集dict_group
)
import pandas as pd import matplotlib import matplotlib.pyplot as plt from matplotlib.ticker import MultipleLocator %matplotlib inline #為了顯示中文 matplotlib.rcParams["font.sans-serif"] = ["Microsoft YaHei Mono"] matplotlib.rcParams["axes.unicode_minus"] = False #根據(jù)key顯示兩個(gè)數(shù)據(jù)集 def draw(key1, key2): with plt.style.context("seaborn-v0_8"): fig = plt.figure() ax = fig.add_axes([0.1, 0.1, 0.8, 0.8]) ax.xaxis.set_major_locator(MultipleLocator(4)) ax.xaxis.set_minor_locator(MultipleLocator(2)) data = dict_group[key1] ax.plot(data["sjCN"], data["value"], "b--o", label=key1) data = dict_group[key2] ax.plot(data["sjCN"], data["value"], "g:d", label=key2) ax.legend()
首先看下男女人口的變化趨勢(shì):
key1 = "女性人口(萬(wàn)人)" key2 = "男性人口(萬(wàn)人)" #男性人口和女性人口的變化趨勢(shì) dict_group[key1] = dict_group[key1].sort_values("sj") dict_group[key2] = dict_group[key2].sort_values("sj") draw(key1, key2)
看這個(gè)趨勢(shì)變化,男女人口的差距長(zhǎng)期都在幾千萬(wàn)上下,所以找不到女朋友也許不是你的責(zé)任 : )
再看看城鎮(zhèn)和鄉(xiāng)村的人口變化。
key1 = "鄉(xiāng)村人口(萬(wàn)人)" key2 = "城鎮(zhèn)人口(萬(wàn)人)" #鄉(xiāng)村人口和城鎮(zhèn)人口的變化趨勢(shì) dict_group[key1] = dict_group[key1].sort_values("sj") dict_group[key2] = dict_group[key2].sort_values("sj") draw(key1, key2)
從圖中可以看出,1994年左右,鄉(xiāng)村人口開(kāi)始進(jìn)入城鎮(zhèn);
2010年左右,城鎮(zhèn)人口開(kāi)始超越鄉(xiāng)村人口,且人口差距越來(lái)越大。
折線圖最適合的場(chǎng)景就是展示這類有趨勢(shì)變化的數(shù)據(jù)。
到此這篇關(guān)于Matplotlib實(shí)戰(zhàn)之折線圖繪制詳解的文章就介紹到這了,更多相關(guān)Matplotlib折線圖內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
在django中實(shí)現(xiàn)choices字段獲取對(duì)應(yīng)字段值
這篇文章主要介紹了在django中實(shí)現(xiàn)choices字段獲取對(duì)應(yīng)字段值,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-07-07Python 中數(shù)組和數(shù)字相乘時(shí)的注意事項(xiàng)說(shuō)明
這篇文章主要介紹了Python 中數(shù)組和數(shù)字相乘時(shí)的注意事項(xiàng)說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-05-05Python中將圖像轉(zhuǎn)換為PDF的方法實(shí)現(xiàn)
本文主要介紹了Python中將圖像轉(zhuǎn)換為PDF的方法實(shí)現(xiàn),主要使用img2pdf和PyPDF2軟件包,具有一定的參考價(jià)值,感興趣的可以了解一下2023-08-08windows下wxPython開(kāi)發(fā)環(huán)境安裝與配置方法
這篇文章主要介紹了windows下wxPython開(kāi)發(fā)環(huán)境安裝與配置方法,需要的朋友可以參考下2014-06-06通過(guò)代碼簡(jiǎn)單了解django model序列化作用
這篇文章主要介紹了通過(guò)代碼簡(jiǎn)單了解django model序列化作用,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-11-11python進(jìn)階collections標(biāo)準(zhǔn)庫(kù)使用示例詳解
這篇文章主要為大家介紹了python進(jìn)階collections標(biāo)準(zhǔn)庫(kù)使用示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-11-11淺談Python里面None True False之間的區(qū)別
這篇文章主要介紹了淺談Python里面None True False之間的區(qū)別,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-07-07