亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Pandas?Groupby之在Python中匯總、聚合和分組數據的示例詳解

 更新時間:2023年07月24日 15:19:01   作者:吃肉的小饅頭  
GroupBy是一個非常簡單的概念,我們可以創(chuàng)建一個類別分組,并對這些類別應用一個函數,本文給大家介紹Pandas?Groupby之如何在Python中匯總、聚合和分組數據,感興趣的朋友跟隨小編一起看看吧

GroupBy是一個非常簡單的概念。我們可以創(chuàng)建一個類別分組,并對這些類別應用一個函數。這是一個簡單的概念,但它是一種在數據科學中廣泛使用的非常有價值的技術。在真實的的數據科學項目中,您將處理大量數據并一遍又一遍地嘗試,因此為了提高效率,我們使用Groupby概念。Groupby概念非常重要,因為它能夠有效地匯總、聚合和分組數據。

匯總

匯總包括統計,描述數據幀中存在的所有數據。我們可以使用describe()方法總結數據框中的數據。此方法用于從數據幀中獲取min、max、sum、count值沿著該特定列的數據類型。

  • describe():此方法詳細說明數據類型及其屬性。

dataframe_name.describe()

  • unique():此方法用于從給定列中獲取所有唯一值。

dataframe[‘column_name].unique()

  • nunique():這個方法類似于unique,但它會返回唯一值的計數。

dataframe_name[‘column_name].nunique()

  • info():此命令用于獲取數據類型和列信息
  • columns:此命令用于顯示數據框中存在的所有列名

示例:

# importing pandas as pd for using data frame
import pandas as pd
# creating dataframe with student details
dataframe = pd.DataFrame({'id': [7058, 4511, 7014, 7033],
                          'name': ['sravan', 'manoj', 'aditya', 'bhanu'],
                          'Maths_marks': [99, 97, 88, 90],
                          'Chemistry_marks': [89, 99, 99, 90],
                          'telugu_marks': [99, 97, 88, 80],
                          'hindi_marks': [99, 97, 56, 67],
                          'social_marks': [79, 97, 78, 90], })
# display dataframe
dataframe

在這里插入圖片描述

# describing the data frame
print(dataframe.describe())
print("-----------------------------")
# finding unique values
print(dataframe['Maths_marks'].unique())
print("-----------------------------")
# counting unique values
print(dataframe['Maths_marks'].nunique())
print("-----------------------------")
# display the columns in the data frame
print(dataframe.columns)
print("-----------------------------")
# information about dataframe
print(dataframe.info())

在這里插入圖片描述

聚合

聚合用于獲得數據幀中所有列或數據幀中特定列的均值、平均值、方差和標準差。

  • sum():返回數據幀的和

dataframe[‘column].sum()

  • mean():返回數據框中特定列的平均值
  • std():返回該列的標準差。
  • var():返回該列的方差
  • min():返回列中的最小值
  • max():返回列中的最大值

示例:

# importing pandas as pd for using data frame
import pandas as pd
# creating dataframe with student details
dataframe = pd.DataFrame({'id': [7058, 4511, 7014, 7033],
                          'name': ['sravan', 'manoj', 'aditya', 'bhanu'],
                          'Maths_marks': [99, 97, 88, 90],
                          'Chemistry_marks': [89, 99, 99, 90],
                          'telugu_marks': [99, 97, 88, 80],
                          'hindi_marks': [99, 97, 56, 67],
                          'social_marks': [79, 97, 78, 90], })
# display dataframe
dataframe

在這里插入圖片描述

# getting all minimum values from
# all columns in a dataframe
print(dataframe.min())
print("-----------------------------------------")
# minimum value from a particular
# column in a data frame
print(dataframe['Maths_marks'].min())
print("-----------------------------------------")
# computing maximum values
print(dataframe.max())
print("-----------------------------------------")
# computing sum
print(dataframe.sum())
print("-----------------------------------------")
# finding count
print(dataframe.count())
print("-----------------------------------------")
# computing standard deviation
print(dataframe.std())
print("-----------------------------------------")
# computing variance
print(dataframe.var())

在這里插入圖片描述

分組

它用于通過使用groupby()方法對數據幀中的一個或多個列進行分組。Groupby主要是指涉及以下步驟中的一個或多個的過程:

  • 拆分:這是一個通過對數據集應用某些條件將數據拆分成組的過程。
  • 應用:它是一個過程,在這個過程中,我們將一個函數獨立地應用于每個組
  • 組合:這是一個在應用groupby后將不同數據集組合在一起并生成數據結構的過程
# importing pandas as pd for using data frame
import pandas as pd
# creating dataframe with student details
dataframe = pd.DataFrame({'id': [7058, 4511, 7014, 7033],
                          'name': ['sravan', 'manoj', 'aditya', 'bhanu'],
                          'Maths_marks': [99, 97, 88, 90],
                          'Chemistry_marks': [89, 99, 99, 90],
                          'telugu_marks': [99, 97, 88, 80],
                          'hindi_marks': [99, 97, 56, 67],
                          'social_marks': [79, 97, 78, 90], })
# group by name
print(dataframe.groupby('name').first())
print("---------------------------------")
# group by name with social_marks sum
print(dataframe.groupby('name')['social_marks'].sum())
print("---------------------------------")
# group by name with maths_marks count
print(dataframe.groupby('name')['Maths_marks'].count())
print("---------------------------------")
# group by name with maths_marks
print(dataframe.groupby('name')['Maths_marks'])

在這里插入圖片描述

import pandas as pd
# creating dataframe with student details
dataframe = pd.DataFrame({'id': [7058, 4511, 7014, 7033],
                          'name': ['sravan', 'manoj', 'aditya', 'bhanu'],
                          'Maths_marks': [99, 97, 88, 90],
                          'Chemistry_marks': [89, 99, 99, 90],
                          'telugu_marks': [99, 97, 88, 80],
                          'hindi_marks': [99, 97, 56, 67],
                          'social_marks': [79, 97, 78, 90], })
# group by name
print(dataframe.groupby('name').first())
print("------------------------")
# group by name with social_marks sum
print(dataframe.groupby('name')['social_marks'].sum())
print("------------------------")
# group by name with maths_marks count
print(dataframe.groupby('name')['Maths_marks'].count())

在這里插入圖片描述

到此這篇關于Pandas Groupby之如何在Python中匯總、聚合和分組數據的文章就介紹到這了,更多相關Python匯總、聚合和分組數據內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Python內置函數delattr的具體用法

    Python內置函數delattr的具體用法

    本篇文章主要介紹了Python內置函數delattr的具體用法,小編覺得挺不錯的,現在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-11-11
  • python類的繼承實例詳解

    python類的繼承實例詳解

    這篇文章主要介紹了python類的繼承實例詳解的相關資料,需要的朋友可以參考下
    2017-03-03
  • Pandas拼接concat使用方法

    Pandas拼接concat使用方法

    當我們需要將兩個Pandas DataFrame對象合并為一個時,就需要使用Pandas拼接函數,本文主要介紹了Pandas拼接concat使用方法,感興趣的可以了解一下
    2023-12-12
  • 淺析Python中的套接字編程

    淺析Python中的套接字編程

    不可否認,互聯網已成為“存在之魂”,其活動以“連接”或“網絡”為特征。使用套接字的最關鍵的基礎之一,使這些網絡成為可能。本文涵蓋了有關使用Python進行套接字編程的所有領域。套接字可以幫助您建立這些連接,而Python無疑可以簡化連接
    2021-06-06
  • TensorFlow2.X結合OpenCV 實現手勢識別功能

    TensorFlow2.X結合OpenCV 實現手勢識別功能

    這篇文章主要介紹了TensorFlow2.X結合OpenCV 實現手勢識別功能,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-04-04
  • Django調用支付寶接口代碼實例詳解

    Django調用支付寶接口代碼實例詳解

    這篇文章主要介紹了Django調用支付寶接口代碼實例詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-04-04
  • python實現dijkstra最短路由算法

    python實現dijkstra最短路由算法

    這篇文章主要為大家詳細介紹了python實現dijkstra最短路由算法,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-01-01
  • python 巡檢腳本的項目實踐

    python 巡檢腳本的項目實踐

    本文主要介紹了python 巡檢腳本的項目實踐,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-04-04
  • Python通過keyboard庫實現模擬和監(jiān)聽鍵盤

    Python通過keyboard庫實現模擬和監(jiān)聽鍵盤

    這篇文章主要為大家詳細介紹了Python如何通過keyboard庫實現模擬和監(jiān)聽鍵盤,文中的示例代碼講解詳細,感興趣的小伙伴可以了解下
    2024-10-10
  • pampy超強的模式匹配工具的實現

    pampy超強的模式匹配工具的實現

    在自然語言處理界,模式匹配可以說是最常用的技術。甚至可以說,將NLP技術作為真實生產力的項目都少不了模式匹配。本文就介紹了pampy超強的模式匹配工具的實現,感興趣的可以了解一下
    2021-07-07

最新評論