pandas如何統(tǒng)計(jì)某一列或某一行的缺失值數(shù)目
更新時(shí)間:2022年05月12日 11:43:24 作者:WGS.
這篇文章主要介紹了pandas如何統(tǒng)計(jì)某一列或某一行的缺失值數(shù)目,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
統(tǒng)計(jì)某一列或某一行的缺失值數(shù)目
1.使用isnull()
import pandas as pd # 首先導(dǎo)入數(shù)據(jù) df = pd.read_csv('123.csv' , encoding='gbk') # 計(jì)算data每一行有多少個(gè)缺失值的值,即按行統(tǒng)計(jì)缺失值 rows_null = df.isnull().sum(axis=1)? # 下面則是按列統(tǒng)計(jì)缺失值 col_null = df.isnull().sum(axis=0) #統(tǒng)計(jì)整個(gè)df的缺失值 all_null = df.isnull().sum().sum() # 統(tǒng)計(jì)某一列的缺失值 idx_null = df['列名'].isnull().sum(axis=0)
2.使用count
import pandas as pd # 首先導(dǎo)入數(shù)據(jù) df = pd.read_csv('123.csv' , encoding='gbk') # 計(jì)算data每一行有多少個(gè)非空的值,即按行統(tǒng)計(jì)非空值 rows_not_null = df.count(axis=1)? # 下面則是按列統(tǒng)計(jì)非空值 cols_not_null = df.count(axis=0) cols_null = df.shape[1] - cols_not_null # 統(tǒng)計(jì)某一列的非空值 col_not_null = df['列名'].count(axis=0)
利用pandas處理缺失值
處理缺失值
def missing_values(dataframe): ? ? missing_ratio = (dataframe.isnull().sum() / len(dataframe))*100 ? ? missing_ratio = missing_ratio.drop(missing_ratio[missing_ratio == 0].index).sort_values(ascending=False) ? ? missing_count = dataframe.isnull().sum() ? ? missing_count = missing_count.drop(missing_count[missing_count == 0].index).sort_values(ascending=False) ? ? info = pd.DataFrame({'Missing Ratio': missing_ratio, 'Missing Count': missing_count}) ? ? return info
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
您可能感興趣的文章:
- pandas數(shù)據(jù)清洗實(shí)現(xiàn)刪除的項(xiàng)目實(shí)踐
- pandas實(shí)現(xiàn)數(shù)據(jù)讀取&清洗&分析的項(xiàng)目實(shí)踐
- 詳解Python如何利用Pandas與NumPy進(jìn)行數(shù)據(jù)清洗
- 利用pandas進(jìn)行數(shù)據(jù)清洗的方法
- pandas數(shù)據(jù)處理清洗實(shí)現(xiàn)中文地址拆分案例
- Pandas 數(shù)據(jù)處理,數(shù)據(jù)清洗詳解
- pandas數(shù)據(jù)清洗,排序,索引設(shè)置,數(shù)據(jù)選取方法
- pandas返回缺失值位置的方法實(shí)例教程
- pandas中DataFrame檢測(cè)重復(fù)值的實(shí)現(xiàn)
- pandas數(shù)據(jù)清洗(缺失值和重復(fù)值的處理)
相關(guān)文章
Django 創(chuàng)建后臺(tái),配置sqlite3教程
今天小編就為大家分享一篇Django 創(chuàng)建后臺(tái),配置sqlite3教程,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-11-11Python實(shí)現(xiàn)CNN的多通道輸入實(shí)例
今天小編就為大家分享一篇Python實(shí)現(xiàn)CNN的多通道輸入實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-01-01用python + hadoop streaming 分布式編程(一) -- 原理介紹,樣例程序與本地調(diào)試
Hadoop 是一個(gè)實(shí)現(xiàn)了 MapReduce 計(jì)算模型的開(kāi)源分布式并行編程框架,借助于 Hadoop, 程序員可以輕松地編寫分布式并行程序,將其運(yùn)行于計(jì)算機(jī)集群上,完成海量數(shù)據(jù)的計(jì)算。2014-07-07matplotlib命令與格式之tick坐標(biāo)軸日期格式(設(shè)置日期主副刻度)
這篇文章主要介紹了matplotlib命令與格式之tick坐標(biāo)軸日期格式(設(shè)置日期主副刻度),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08利用Python實(shí)現(xiàn)崗位的分析報(bào)告
這篇文章主要為大家詳細(xì)介紹了如何利用Python實(shí)現(xiàn)崗位的分析報(bào)告,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2023-03-03