快捷導航

pandas實現(xiàn)按照Series分組示例

更新時間：2021年08月08日 14:25:38 作者：不思量自難忘

本文主要介紹了pandas按照Series分組示例，文中通過示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下

result:
      分類編號    名稱
0 水果 0    蘋果
1 水果 1    橙子
2 生活用品 2    牙刷
3 生活用品 3    冰箱
4 生活用品 4 電視機
5 食物 0    蘋果
6 食物 1    橙子
7 家電 3    冰箱
8 家電 4 電視機
9 大件 3    冰箱
10    大件 4 電視機
11    大件 5    茶幾
12 生活用品 7 暖手寶寶
13 小說 8 紅樓夢

將DataFrame的其中一列取出來就是一個Series，比如life_df["分類"]就是一個Series

1 按照一個Series進行分組

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分類"]))

result:

<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001506806C6C8>

從上面的結(jié)果可以看出，如果只是傳入Series，分組后的結(jié)果是一個DataFrameGroupBy對象。這個對象包含著分組以后的若干組數(shù)據(jù)，但是沒有直接顯示出來，需要對這些分組數(shù)據(jù)進行匯總計算以后才會顯示出來

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分類"]).count())

result:
編號名稱

分類
大件 3 3
家電 2 2
小說 1 1
水果 2 2
生活用品 4 4
食物 2 2

上面的代碼是根據(jù)物品分類對所有數(shù)據(jù)進行了分組，然后對分組以后的數(shù)據(jù)分別進行計數(shù)運算，最后進行合并。

由于對分組后的數(shù)據(jù)進行了計數(shù)運算，因此每一列都會有一個結(jié)果。但是如果對分組后的結(jié)果做一些數(shù)值運算，這個時候只有數(shù)據(jù)類型是數(shù)值(int、float)的列才會參與運算

import pandas as pd
life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分類"]).sum())

result:
編號

分類
大件 12
家電 7
小說 8
水果 1
生活用品 16
食物 1

我們把這種對分組后的數(shù)據(jù)進行匯總運算的操作稱為聚合，使用的函數(shù)稱為聚合函數(shù)。比如前面系列文章提高的非空值計數(shù)、sum求和、最大值最小值、均值、中位數(shù)、眾數(shù)、方差、標準差和分位數(shù)這些。都屬于聚合函數(shù)。

2 按照多個Series進行分組

多Series分組和單Series分組差不多，只要將多個Series以列表的形式傳遞給groupby()即可。

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby([life_df["分類"], life_df["名稱"]]).count())

result:
   編號

分類名稱
大件冰箱 1
   電視機    1
   茶幾 1
家電冰箱 1
   電視機    1
小說紅樓夢    1
水果橙子 1
   蘋果 1
生活用品冰箱 1
     暖手寶寶 1
   牙刷 1
   電視機    1
食物橙子 1
   蘋果 1

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby([life_df["分類"], life_df["名稱"]]).sum())

result:
   編號

分類名稱
大件冰箱 3
   電視機    4
   茶幾 5
家電冰箱 3
   電視機    4
小說紅樓夢    8
水果橙子 1
   蘋果 0
生活用品冰箱 3
   暖手寶寶 7
   牙刷 2
   電視機    4
食物橙子 1
   蘋果 0

3 分組和聚合采用不同的列或Series進行

這里和按列分組的用法一致

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分類"])["名稱"].count())

result:
分類
大件    3
家電    2
小說      1
水果    2
生活用品    4
食物    2
Name: 名稱, dtype: int64

這里就是按照物品分類進行分組，再按照物品名稱進行匯總統(tǒng)計

到此這篇關(guān)于pandas實現(xiàn)按照Series分組示例的文章就介紹到這了,更多相關(guān)pandas Series分組內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

pandas實現(xiàn)按照Series分組示例

目錄

1 按照一個Series進行分組

2 按照多個Series進行分組

3 分組和聚合采用不同的列或Series進行

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具