亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python中使用matplotlib繪制熱力圖

 更新時間:2023年08月29日 11:03:56   作者:databook  
熱力圖,是一種通過對色塊著色來顯示數(shù)據(jù)的統(tǒng)計圖表,它通過使用顏色編碼來表示數(shù)據(jù)的值,并在二維平面上呈現(xiàn)出來,本文就給大家介紹一下python使用matplotlib繪制熱力圖的方法,需要的朋友可以參考下

熱力圖,是一種通過對色塊著色來顯示數(shù)據(jù)的統(tǒng)計圖表。
它通過使用顏色編碼來表示數(shù)據(jù)的值,并在二維平面上呈現(xiàn)出來。
熱力圖通常用于顯示大量數(shù)據(jù)點的密度、熱點區(qū)域和趨勢。

繪圖時,一般較大的值由較深的顏色表示,較小的值由較淺的顏色表示;較大的值由偏暖的顏色表示,較小的值由較冷的顏色表示,等等。

熱力圖適合用于查看總體的情況、發(fā)現(xiàn)異常值、顯示多個變量之間的差異,以及檢測它們之間是否存在任何相關性。

1. 主要元素

熱力圖的主要元素如下:

  • 矩形塊:每個矩形塊都有一個對應的位置。表示某種屬性、頻率、密度等。
  • 顏色映射:通常使用漸變色帶來表示數(shù)值的大小或密度。常見的顏色映射包括從冷色調(如藍色)到熱色調(如紅色)的漸變,表示數(shù)值從低到高的變化。
  • 熱力密度:通過顏色的深淺來表示數(shù)據(jù)的密度或頻率。較淺的顏色表示較低的密度或頻率,而較深的顏色表示較高的密度或頻率。
  • 坐標軸:熱力圖通常在二維平面上顯示,因此會有兩個坐標軸,分別表示水平和垂直方向上的位置。

2. 適用的場景

熱力圖適用于以下分析場景:

  • 數(shù)據(jù)密度分析:顯示數(shù)據(jù)點的密度分布情況。它可以幫助用戶觀察數(shù)據(jù)的聚集區(qū)域和稀疏區(qū)域,從而揭示數(shù)據(jù)的分布模式和趨勢。
  • 熱點區(qū)域識別:識別數(shù)據(jù)中的熱點區(qū)域,即數(shù)據(jù)密度較高的區(qū)域。對于發(fā)現(xiàn)熱門地區(qū)、熱門產品或熱門事件等具有重要意義。
  • 趨勢分析:通過觀察顏色的變化,可以分析數(shù)據(jù)在不同區(qū)域或時間段的變化趨勢。
  • 空間數(shù)據(jù)分析:在地理信息系統(tǒng)(GIS)和位置數(shù)據(jù)分析中,可以顯示地理空間上的數(shù)據(jù)分布和密度,幫助用戶理解地理區(qū)域的特征和差異。
  • 網站流量分析:顯示用戶在網頁上的點擊熱度和瀏覽熱度。這有助于優(yōu)化網站布局、改進用戶體驗和提高轉化率。

3. 不適用的場景

熱力圖在以下分析場景中可能不適用:

  • 無序數(shù)據(jù):對于無序的數(shù)據(jù),熱力圖可能無法提供有意義的分析結果。
  • 數(shù)據(jù)缺失:如果數(shù)據(jù)中存在大量缺失值或空白區(qū)域,可能無法準確地反映數(shù)據(jù)的密度和分布情況。
  • 多個并行路徑:通常用于展示單一維度的數(shù)據(jù)分布情況。如果需要同時比較多個維度或路徑的數(shù)據(jù),熱力圖可能不是最合適的選擇。

4. 分析實戰(zhàn)

本次分析今年上半年南京主要的幾個區(qū)二手房的成交數(shù)量情況。

4.1. 數(shù)據(jù)來源

數(shù)據(jù)來自鏈家網南京地區(qū)的二手房成交的頁面。
整理好的數(shù)據(jù)可以從下面的地址下載:https://databook.top/lianjia/nj

各個區(qū)的二手房交易數(shù)據(jù)已經整理成csv格式。

import os
df_dict = {}
#數(shù)據(jù)解壓的地址
fp = "d:/share/data/南京二手房交易"
for f in os.listdir(fp):
    df = pd.read_csv(os.path.join(fp, f))
    df_dict[f] = df
df_dict  #合并所有區(qū)的數(shù)據(jù)

4.2. 數(shù)據(jù)清理

清理數(shù)據(jù)的主要幾個步驟:

  • dealDate列轉換為 日期(datetime)格式
  • 按周統(tǒng)計的交易數(shù)量
  • 統(tǒng)計結果保存到新的字典中(df_stat),取日期最近的10條
df_stat = {}
for k, df in df_dict.items():
    df["dealDate"] = pd.to_datetime(df["dealDate"])
    # 最近10周的交易量
    week_sum = df.resample("W", on="dealDate").name.count()
    week_sum = week_sum.sort_index(ascending=False)
    df_stat[k.replace(".csv", "")] = week_sum.head(10)
df_stat

4.3. 分析結果可視化

更加各個區(qū)的成交數(shù)量繪制最近10周的交易熱力圖。

x_labels = []
y_labels = df_stat.keys() # Y周的標簽
data = []
for _, v in df_stat.items():
    if len(x_labels) == 0: # X軸的日期標簽
        x_labels = v.index.strftime("%Y-%m-%d").tolist()
        x_labels.reverse()
    v = v.sort_index()
    data.append(v.tolist())
plt.xticks(ticks=np.arange(len(x_labels)), 
           labels=x_labels,
           rotation=45)
plt.yticks(ticks=np.arange(len(y_labels)), 
           labels=y_labels)
plt.imshow(data, cmap=plt.cm.hot_r)
plt.colorbar()
plt.show()

從熱力圖中可以看出,江寧區(qū)浦口區(qū)的成交數(shù)量明顯多于其他區(qū),尤其是江寧區(qū)。
其次是鼓樓區(qū)秦淮區(qū)稍好一些(可能和這2個區(qū)學區(qū)房比較多有關),而溧水區(qū)六合區(qū)明顯交易量不行。

以上就是python中使用matplotlib繪制熱力圖的詳細內容,更多關于python matplotlib熱力圖的資料請關注腳本之家其它相關文章!

相關文章

最新評論