Python中Pandas庫的數(shù)據(jù)處理與分析
一、Pandas的數(shù)據(jù)結(jié)構(gòu)
Pandas主要有兩種數(shù)據(jù)結(jié)構(gòu):Series
和DataFrame
。
1. Series
Series
是一種類似于一維數(shù)組的對象,它由一組數(shù)據(jù)和一組與之相關(guān)的數(shù)據(jù)標(biāo)簽(即索引)組成。
import pandas as pd s = pd.Series([1, 3, 5, np.nan, 6, 8]) print(s)
2. DataFrame
DataFrame
是一種二維的表格型數(shù)據(jù)結(jié)構(gòu),每列可以是不同的值類型(數(shù)值、字符串、布爾值等)。DataFrame既有行索引也有列索引,它可以被看做由Series組成的字典(共用同一個索引)。
import pandas as pd data = {'Country': ['Belgium', 'India', 'Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasília'], 'Population': [11190846, 1303171035, 207847528]} df = pd.DataFrame(data, columns=["Country", "Capital", "Population"]) print(df)
二、數(shù)據(jù)讀取與寫入
Pandas提供了一些用于將表格型數(shù)據(jù)讀取為DataFrame對象的函數(shù),支持多種格式的數(shù)據(jù),如csv、excel、json、html、sql等。
import pandas as pd # 從CSV文件中讀取數(shù)據(jù) df = pd.read_csv('file.csv') # 將數(shù)據(jù)寫入CSV文件中 df.to_csv('file.csv')
三、數(shù)據(jù)選擇與操作
Pandas提供了多種方式進(jìn)行數(shù)據(jù)的選擇與操作。
import pandas as pd # 創(chuàng)建一個數(shù)據(jù)集 data = {'Name': ['Tom', 'Nick', 'John', 'Tom'], 'Age': [20, 21, 19, 20], 'Country':['US', 'UK', 'US', 'UK']} df = pd.DataFrame(data) # 選擇'Name'列 df['Name'] # 選擇第0行 df.iloc[0] # 選擇滿足條件的行 df[df.Age > 20] # 對'Age'列進(jìn)行求和 df['Age'].sum() # 對'Country'列進(jìn)行計數(shù) df['Country'].value_counts()
Pandas的功能遠(yuǎn)不止這些,還包括合并、分組、缺失數(shù)據(jù)處理、數(shù)據(jù)透視表等高級功能,為數(shù)據(jù)處理和分析提供了強大的工具。
到此這篇關(guān)于Python中Pandas庫的數(shù)據(jù)處理與分析的文章就介紹到這了,更多相關(guān)Python Pandas庫內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
使用python獲取csv文本的某行或某列數(shù)據(jù)的實例
下面小編就為大家分享一篇使用python獲取csv文本的某行或某列數(shù)據(jù)的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-04-04Python遠(yuǎn)程方法調(diào)用實現(xiàn)過程解析
這篇文章主要介紹了Python遠(yuǎn)程方法調(diào)用實現(xiàn)過程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-07-07