亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Matplotlib直方圖繪制中的參數bins和rwidth的實現

 更新時間:2022年02月04日 10:41:46   作者:orion-orion  
本文主要介紹了Matplotlib直方圖繪制中的參數bins和rwidth的實現,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

情景引入

我們在做機器學習相關項目時,常常會分析數據集的樣本分布,而這就需要用到直方圖的繪制。

在Python中可以很容易地調用matplotlib.pyplot的hist函數來繪制直方圖。不過,該函數參數不少,有幾個繪圖的小細節(jié)也需要注意。

首先,我們假定現在有個聯邦學習的項目情景。我們有一個樣本個數為15的圖片數據集,樣本標簽有4個,分別為cat, dog, car, ship。這個數據集已經被不均衡地劃分到4個任務節(jié)點(client)上。 情境引入

我們在做機器學習相關項目時,常常會分析數據集的樣本分布,而這就需要用到直方圖的繪制。

在Python中可以很容易地調用matplotlib.pyplothist函數來繪制直方圖。不過,該函數參數不少,有幾個繪圖的小細節(jié)也需要注意。

首先,我們假定現在有個聯邦學習的項目情景。我們有一個樣本個數為15的圖片數據集,樣本標簽有4個,分別為cat, dog, car, ship。這個數據集已經被不均衡地劃分到4個任務節(jié)點(client)上,如像下面表示:

N_CLIENTS = 3 
num_cls, classes = 4, ['cat', 'dog', 'car', 'ship']
train_labels = [0, 3, 2, 0, 3, 2, 1, 0, 3, 3, 1, 0, 3, 2, 2] #數據集的標簽列表

client_idcs = [slice(0, 4), slice(4, 11), slice(11, 15)]
# 數據集樣本在client上的劃分情況

我們需要可視化樣本在任務節(jié)點的分布情況。我們第一次可能會寫出如下代碼:

import matplotlib.pyplot as plt
import numpy as np

plt.figure(figsize=(5,3))
plt.hist([train_labels[idc]for idc in client_idcs], stacked=False, 
         bins=num_cls,
        label=["Client {}".format(i) for i in range(N_CLIENTS)])

plt.xticks(np.arange(num_cls), classes)
plt.legend()
plt.show()

此時的可視化結果如下:

這時我們會發(fā)現,我們x軸上的標簽和上方的bar(每個圖像類別對應的3個bar合稱為1個bin)并沒有對齊,而這時劇需要我們調整bins這個參數。

bins 參數

在講述bins參數之前我們先來熟悉一下hist繪圖中bin和bar的含義。下面是它們的詮釋圖:

這里\(x_1\)、\(x_2\)是x軸對象,在hist中,默認x軸第一個對象對應刻度為0,第2個對象刻度為1,依次類圖。在這個詮釋圖上,bin(原意為垃圾箱)就是指每個x軸對象所占優(yōu)的矩形繪圖區(qū)域,bar(原意為塊)就是指每個矩形繪圖區(qū)域中的條形。 如上圖所示,x軸第一個對象對應的bin區(qū)間為[-0.5, 0.5),第2個對象對應的bin區(qū)域為[0.5, 1)(注意,hist規(guī)定一定是左閉又開)。每個對象的bin區(qū)域內都有3個bar。

通過查閱matplotlib文檔,我們知道了bins參數的解釋如下:

bins: int or sequence or str, default: rcParams["hist.bins"] (default: 10)

If bins is an integer, it defines the number of equal-width bins in the range.

If bins is a sequence, it defines the bin edges, including the left edge of the first bin and the right edge of the last bin; in this case, bins may be unequally spaced. All but the last (righthand-most) bin is half-open. In other words, if bins is:

[1, 2, 3, 4]

then the first bin is [1, 2) (including 1, but excluding 2) and the second [2, 3). The last bin, however, is [3, 4], which includes 4.

If bins is a string, it is one of the binning strategies supported by numpy.histogram_bin_edges: 'auto', 'fd', 'doane', 'scott', 'stone', 'rice', 'sturges', or 'sqrt'.

我來概括一下,也就是說如果bins是個數字,那么它設置的是bin的個數,也就是沿著x軸劃分多少個獨立的繪圖區(qū)域。我們這里有四個圖像類別,故需要設置4個繪圖區(qū)域,每個區(qū)域相對于x軸刻度的偏移采取默認設置。

不過,如果我們要設置每個區(qū)域的位置偏移,我們就需要將bins設置為一個序列。

bins序列的刻度要參照hist函數中的x坐標刻度來設置,本任務中4個分類類別對應的x軸刻度分別為[0, 1, 2, 3] 。如果我們將序列設置為[0, 1, 2, 3, 4]就表示第一個繪圖區(qū)域對應的區(qū)間是[1, 2),第2個繪圖區(qū)域對應的位置是[1, 2),第三個繪圖區(qū)域對應的位置是[2, 3),依次類推。

就大眾審美而言,我們想讓每個區(qū)域的中心和對應x軸刻度對齊,這第一個區(qū)域的區(qū)間為[-0.5, 0.5),第二個區(qū)域的區(qū)間為[0.5, 1.5),依次類推。則最終的bins序列為[-0.5, 0.5, 1.5, 2.5, 3.5]。于是,我們將hist函數修改如下:

plt.hist([train_labels[idc]for idc in client_idcs], stacked=False, 
         bins=np.arange(-0.5, 4, 1),
        label=["Client {}".format(i) for i in range(N_CLIENTS)])

這樣,每個劃分區(qū)域和對應x軸的刻度就對齊了:

stacked參數

有時x軸的項目多了,每個x軸的對象都要設置3個bar對繪圖空間無疑是一個巨大的占用。在這個情況下我們如何壓縮空間的使用呢?這個時候參數stacked就派上了用場,我們將參數stacked設置為True:

plt.hist([train_labels[idc]for idc in client_idcs],stacked=True 
         bins=np.arange(-0.5, 4, 1),
        label=["Client {}".format(i) for i in range(N_CLIENTS)])

可以看到每個x軸對象的bar都“疊加”起來了:

不過,新的問題又出來了,這樣每x軸對象的bar之間完全沒有距離了,顯得十分“擁擠”,我們可否修改bins參數以設置區(qū)域bin之間的間距呢?答案是不行,因為我們前面提到過,bins參數中只能將區(qū)域設置為連續(xù)排布的。

換一個思路,我們設置每個bin內的bar和bin邊界之間的間距。此時,我們需要修改r_width參數。

rwidth 參數

我們看文檔中對rwidth參數的解釋:

rwidth float or None, default: None

The relative width of the bars as a fraction of the bin width. If None, automatically compute the width.

Ignored if histtype is 'step' or 'stepfilled'.

翻譯一下,rwidth用于設置每個bin中的bar相對bin的大小。這里我們不妨修改為0.5:

plt.hist([train_labels[idc]for idc in client_idcs],stacked=True, 
         bins=np.arange(-0.5, 4, 1), rwidth=0.5, 
        label=["Client {}".format(i) for i in range(N_CLIENTS)])

修改之后的圖表如下:

可以看到每個x軸元素內的bar正好占對應bin的寬度的二分之一。

引用

[1] https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html

到此這篇關于Matplotlib直方圖繪制中的參數bins和rwidth的實現的文章就介紹到這了,更多相關Matplotlib bins rwidth內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Python實現有趣的親戚關系計算器

    Python實現有趣的親戚關系計算器

    每年的春節(jié),都會有一些自己幾乎沒印象但父母就是很熟的親戚,關系凌亂到你自己都說不清。本文就來用Python制作一個有趣的親戚關系計算器,感興趣的可以了解一下
    2023-01-01
  • python 牛頓法實現邏輯回歸(Logistic Regression)

    python 牛頓法實現邏輯回歸(Logistic Regression)

    這篇文章主要介紹了python 牛頓法實現邏輯回歸(Logistic Regression),幫助大家更好的進行機器學習,感興趣的朋友可以了解下
    2020-10-10
  • Python合并多個裝飾器小技巧

    Python合并多個裝飾器小技巧

    這篇文章主要介紹了Python合并多個裝飾器小技巧,本文用改寫調用函數的方式實現把多個裝飾器合并成一行、一個函數來調用,需要的朋友可以參考下
    2015-04-04
  • 解決django無法訪問本地static文件(js,css,img)網頁里js,cs都加載不了

    解決django無法訪問本地static文件(js,css,img)網頁里js,cs都加載不了

    這篇文章主要介紹了解決django無法訪問本地static文件(js,css,img)網頁里js,cs都加載不了的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-04-04
  • Python基于內置函數type創(chuàng)建新類型

    Python基于內置函數type創(chuàng)建新類型

    這篇文章主要介紹了Python基于內置函數type創(chuàng)建新類型,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-10-10
  • python unichr函數知識點總結

    python unichr函數知識點總結

    在本篇文章里小編給大家整理的是一篇關于python unichr函數的知識點總結內容,有興趣的朋友們可以學習下。
    2020-12-12
  • python導入csv文件出現SyntaxError問題分析

    python導入csv文件出現SyntaxError問題分析

    這篇文章主要介紹了python導入csv文件出現SyntaxError問題分析,同時涉及python導入csv文件的三種方法,具有一定借鑒價值,需要的朋友可以參考下。
    2017-12-12
  • python實現一個函數版的名片管理系統(tǒng)過程解析

    python實現一個函數版的名片管理系統(tǒng)過程解析

    這篇文章主要介紹了python實現一個函數版的名片管理系統(tǒng)過程解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-08-08
  • 簡單了解python字符串前面加r,u的含義

    簡單了解python字符串前面加r,u的含義

    這篇文章主要介紹了簡單了解python字符串前面加r,u的含義,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-12-12
  • python http基本驗證方法

    python http基本驗證方法

    今天小編就為大家分享一篇python http基本驗證方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-12-12

最新評論