Python數(shù)據(jù)可視化編程通過Matplotlib創(chuàng)建散點(diǎn)圖代碼示例
Matplotlib簡述:
Matplotlib是一個用于創(chuàng)建出高質(zhì)量圖表的桌面繪圖包(主要是2D方面)。該項(xiàng)目是由JohnHunter于2002年啟動的,其目的是為Python構(gòu)建一個MATLAB式的繪圖接口。如果結(jié)合PythonIDE使用比如PyCharm,matplotlib還具有諸如縮放和平移等交互功能。它不僅支持各種操作系統(tǒng)上許多不同的GUI后端,而且還能將圖片導(dǎo)出為各種常見的矢量(vector)和光柵(raster)圖:PDF、SVG、JPG、PNG、BMP、GIF等。此外,matplotlib還有許多插件工具集,如用于3D圖形的mplot3d以及用于地圖和投影的basemap。
準(zhǔn)備數(shù)據(jù):從文本文件中解析數(shù)據(jù)
本文使用的數(shù)據(jù)主要包含以下三種特征:每年獲得的飛行常客里程數(shù),玩視頻游戲所耗時間百分比,每周消費(fèi)的冰淇淋公升數(shù)。其中分類結(jié)果作為文件的第四列,并且只有3、2、1三種分類值。
飛行里程數(shù) | |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
...... | |
|
|
上述特征數(shù)據(jù)的格式經(jīng)過file2matrix函數(shù)解析處理之后,可輸出為矩陣和類標(biāo)簽向量。
將文本記錄轉(zhuǎn)換為Numpy的解析程序:
使用file2matrix讀取文件數(shù)據(jù),必須確保待解析文件存儲在當(dāng)前的工作目錄中。導(dǎo)入數(shù)據(jù)之后,簡單檢查一下數(shù)據(jù)格式:
分析數(shù)據(jù):使用Matplotlib創(chuàng)建散點(diǎn)圖
編輯kNN.py文件,引入matplotlib,調(diào)用matplotlib的scatter繪制散點(diǎn)圖。
import matplotlib import matplotlib.pyplot as plt def file2matrix(filename): ...... return returnMat,classLabelVector datingDataMat,datingLabels = file2matrix('datingTestSet2.txt') fig = plt.figure() ax = fig.add_subpot(111) ax.scatter(datingDataMat[:,1],datingDataMat[:,2]) plt.show()
散點(diǎn)圖使用datingDataMat矩陣的第二、第三列數(shù)據(jù),分別表示特征值“玩視頻游戲所耗時間百分比”和“每周消費(fèi)的冰淇淋公升數(shù)”。
上圖由于沒有使用樣本分類的特征值,很難看到任何有用的數(shù)據(jù)模式信息。為了更好理解數(shù)據(jù)信息,Matplotlib庫提供的scatter函數(shù)支持個性化標(biāo)記散點(diǎn)圖上的點(diǎn)。調(diào)用scatter函數(shù)使用下列參數(shù):
ax.scatter(datingDataMat[:,1],datingDataMat[:,2],15.0*array(datingLabels),15.0*array(datingLabels)) plt.show()
上圖利用datingLabels存儲的類標(biāo)簽屬性,在散點(diǎn)圖上繪制了色彩不等、尺寸不同的點(diǎn)。因而基本上可以從圖中看到數(shù)據(jù)點(diǎn)所屬三個樣本分類的區(qū)域輪廓。為了得到更好的效果,采用datingDataMat矩陣的屬性列1和2展示數(shù)據(jù),并以紅色的'*'表示類標(biāo)簽1、藍(lán)色的'o'表示表示類標(biāo)簽2、綠色的'+'表示類標(biāo)簽3,修改參數(shù)如下:
import numpy as np ...... datingLabels = array(datingLabels) idx_1 = np.where(datingLabels==1) p1 = ax.scatter(datingDataMat[idx_1,0],datingDataMat[idx_1:,1],market = '*',color = 'r',label='1',s=20 idx_2 = np.where(datingLabels==2) p2 = ax.scatter(datingDataMat[idx_2,0],datingDataMat[idx_2:,1],market = 'o',color ='b',label='1',s=10 idx_3 = np.where(datingLabels==3) p3 = ax.scatter(datingDataMat[idx_3,0],datingDataMat[idx_3:,1],market = '+',color ='g',label='1',s=30 plt.legend(loc = 'upper right') plt.show()
總結(jié)
本文簡單介紹了Matplotlib,并以實(shí)例分析了如何使用Matplotlib庫圖形化展示數(shù)據(jù),最后通過修改matplotlib的scatter函數(shù)參數(shù)使得散點(diǎn)圖的分類區(qū)域更加清晰。
希望對大家有所幫助。如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!
- 通過python的matplotlib包將Tensorflow數(shù)據(jù)進(jìn)行可視化的方法
- Python數(shù)據(jù)可視化教程之Matplotlib實(shí)現(xiàn)各種圖表實(shí)例
- python Matplotlib數(shù)據(jù)可視化(1):簡單入門
- python Matplotlib數(shù)據(jù)可視化(2):詳解三大容器對象與常用設(shè)置
- Python數(shù)據(jù)可視化之用Matplotlib繪制常用圖形
- python數(shù)據(jù)可視化之matplotlib.pyplot基礎(chǔ)以及折線圖
- Python 數(shù)據(jù)可視化之Matplotlib詳解
- Python利用matplotlib模塊數(shù)據(jù)可視化繪制3D圖
- Python數(shù)據(jù)可視化之使用matplotlib繪制簡單圖表
- Python數(shù)據(jù)分析應(yīng)用之Matplotlib數(shù)據(jù)可視化詳情
相關(guān)文章
Python中的裝飾器鏈(decorator chain)詳解
在Python中,裝飾器是一種高級功能,它允許你在不修改函數(shù)或類代碼的情況下,為它們添加額外的功能,裝飾器通常用于日志記錄、性能測量、權(quán)限檢查等場景,當(dāng)多個裝飾器應(yīng)用于同一個函數(shù)或類時,形成裝飾器鏈,這篇文章主要介紹了Python中的裝飾器鏈詳解,需要的朋友可以參考下2024-06-06python模擬登陸,用session維持回話的實(shí)例
今天小編就為大家分享一篇python模擬登陸,用session維持回話的實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12使用TensorFlow直接獲取處理MNIST數(shù)據(jù)方式
今天小編就為大家分享一篇使用TensorFlow直接獲取處理MNIST數(shù)據(jù)方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02python數(shù)據(jù)挖掘Apriori算法實(shí)現(xiàn)關(guān)聯(lián)分析
這篇文章主要為大家介紹了python數(shù)據(jù)挖掘Apriori算法實(shí)現(xiàn)關(guān)聯(lián)分析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05