Pandas中DataFrame的常用用法分享
Pandas是Python中最流行的數(shù)據(jù)分析和處理工具之一,它提供了一個(gè)名為DataFrame的數(shù)據(jù)結(jié)構(gòu),可以被認(rèn)為是一個(gè)二維表格或電子表格,其中包含行和列。在本文中,我們將深入探討Pandas中DataFrame的各種常用的用法,包括創(chuàng)建DataFrame、選擇數(shù)據(jù)、修改數(shù)據(jù)、數(shù)據(jù)排序、數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)合并、數(shù)據(jù)分組和數(shù)據(jù)透視表等。
1.創(chuàng)建DataFrame
要?jiǎng)?chuàng)建DataFrame,可以使用Pandas中的DataFrame()函數(shù)。下面是一個(gè)例子:
import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 32, 18, 47], 'gender': ['F', 'M', 'M', 'M']} df = pd.DataFrame(data) print(df)
輸出:
name age gender
0 Alice 25 F
1 Bob 32 M
2 Charlie 18 M
3 David 47 M
2.選擇數(shù)據(jù)
在DataFrame中選擇數(shù)據(jù)有幾種方法??梢允褂胠oc[]和iloc[]函數(shù),也可以使用布爾索引。下面是一些例子:
# 使用loc[]函數(shù)選擇數(shù)據(jù) print(df.loc[0]) # 選擇第一行 print(df.loc[0:2]) # 選擇前三行 print(df.loc[0:2, 'name'])# 選擇前三行的name列 # 使用iloc[]函數(shù)選擇數(shù)據(jù) print(df.iloc[0]) # 選擇第一行 print(df.iloc[0:2]) # 選擇前兩行 print(df.iloc[0:2, 0]) # 選擇前兩行的第一列 # 使用布爾索引選擇數(shù)據(jù) print(df[df['age'] > 30]) # 選擇年齡大于30的行
3.修改數(shù)據(jù)
要修改DataFrame中的數(shù)據(jù),可以使用loc[]或iloc[]函數(shù)。下面是一個(gè)例子:
# 修改數(shù)據(jù) df.loc[0, 'age'] = 26 print(df) # 添加新數(shù)據(jù) df.loc[4] = ['Eve', 29, 'F'] print(df) # 刪除數(shù)據(jù) df = df.drop(4) print(df)
4.數(shù)據(jù)排序
要對(duì)DataFrame中的數(shù)據(jù)進(jìn)行排序,可以使用sort_values()函數(shù)。下面是一個(gè)例子:
# 按年齡升序排序 df = df.sort_values('age') print(df) # 按年齡降序排序 df = df.sort_values('age', ascending=False) print(df)
5.數(shù)據(jù)統(tǒng)計(jì)
要對(duì)DataFrame中的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),可以使用describe()函數(shù)和其他函數(shù),例如mean()、median()和std()。下面是一個(gè)例子:
# 描述數(shù)據(jù) print(df.describe()) # 計(jì)算平均年齡 print(df['age'].mean()) # 計(jì)算年齡中位數(shù) print(df['age'].median()) # 計(jì)算年齡標(biāo)準(zhǔn)差 print(df['age'].std())
6.數(shù)據(jù)合并
要合并兩個(gè)DataFrame,可以使用concat()函數(shù)。下面是一個(gè)例子:
# 創(chuàng)建第二個(gè)DataFrame data2 = {'name': ['Frank', 'Grace'], 'age': [39, 28], 'gender': ['M', 'F']} df2 = pd.DataFrame(data2) # 合并兩個(gè)DataFrame df = pd.concat([df, df2]) print(df)
7.數(shù)據(jù)分組
要按某些標(biāo)準(zhǔn)對(duì)DataFrame中的數(shù)據(jù)進(jìn)行分組,可以使用groupby()函數(shù)。下面是一個(gè)例子:
# 按性別分組并計(jì)算平均年齡 print(df.groupby('gender')['age'].mean())
8.數(shù)據(jù)透視表
要?jiǎng)?chuàng)建數(shù)據(jù)透視表,可以使用pivot_table()函數(shù)。下面是一個(gè)例子:
# 創(chuàng)建數(shù)據(jù)透視表 print(pd.pivot_table(df, values='age', index='gender', columns='name'))
到此這篇關(guān)于Pandas中DataFrame的常用用法分享的文章就介紹到這了,更多相關(guān)Pandas DataFrame內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
PyTorch深度學(xué)習(xí)LSTM從input輸入到Linear輸出
這篇文章主要為大家介紹了PyTorch深度學(xué)習(xí)LSTM從input輸入到Linear輸出深入理解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05python3去掉string中的標(biāo)點(diǎn)符號(hào)方法
今天小編就為大家分享一篇python3去掉string中的標(biāo)點(diǎn)符號(hào)方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-01-01ZABBIX3.2使用python腳本實(shí)現(xiàn)監(jiān)控報(bào)表的方法
今天小編就為大家分享一篇ZABBIX3.2使用python腳本實(shí)現(xiàn)監(jiān)控報(bào)表的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-07-07Python中使用ConfigParser解析ini配置文件實(shí)例
這篇文章主要介紹了Python中使用ConfigParser解析ini配置文件實(shí)例,本文給出了創(chuàng)建和讀取ini文件的例子,需要的朋友可以參考下2014-08-08python實(shí)現(xiàn)的發(fā)郵件功能示例
這篇文章主要介紹了python實(shí)現(xiàn)的發(fā)郵件功能,結(jié)合實(shí)例形式分析了Python使用網(wǎng)易郵箱發(fā)送郵件的相關(guān)操作技巧,需要的朋友可以參考下2019-09-09