pandas檢查和填充缺失值的N種方法總結(jié)
一、構(gòu)建示例數(shù)據(jù)
import pandas as pd import numpy as np data = {"ID":[202001, 202002, 202003, 202004, 202005, 202006, 202007, 202008, 202009, 202010], "Chinese":[98, 67, 84, 88, 78, 90, 93, np.nan, 82, 87], "Math":[92, 80, 73, np.nan, 88, 78, 90, 82, 77, 69], "English":[88, 79, 90, 73, 79, 83, 81, np.nan, 71, np.nan] } df = pd.DataFrame(data) df
二、檢查缺失值的n種方法
2.1 確認(rèn)是否有缺失值的兩種方法
df.isnull().values.any()
True
df.isnull().sum().any()
True
2.2 查看缺失數(shù)目和缺失率
df.isnull().sum()
all_data_na = (df.isnull().sum()/len(df))*100 all_data_na = all_data_na.drop(all_data_na[all_data_na == 0].index).sort_values(ascending=False) missing_data = pd.DataFrame({'缺失率' : all_data_na}) missing_data
2.3 查看非缺失值數(shù)目
df.info()
df.shape[0] - df.isnull().sum()
df.notnull().sum()
三、缺失值填充三種示例
# 用上下平均值填充English df['English'] = df['English'].fillna(df['English'].interpolate()) df.head(10)
# 用中位數(shù)填充value列: df['Math'] = df['Math'].fillna(df['Math'].median()) df.head(10)
# 用-1填充Chinese列: df['Chinese'] = df['Chinese'].fillna(-1) df.head(10)
到此這篇關(guān)于pandas檢查和填充缺失值的N種方法總結(jié)的文章就介紹到這了,更多相關(guān)pandas檢查和填充缺失值內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python 解壓、復(fù)制、刪除 文件的實(shí)例代碼
這篇文章主要介紹了python 解壓、復(fù)制、刪除 文件的實(shí)例代碼,代碼簡(jiǎn)單易懂非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-02-02讓文件路徑提取變得更簡(jiǎn)單的Python Path庫(kù)
這里我們介紹 Python3 自帶的庫(kù) Path,可以讓我們使用更少的代碼但是與之而來(lái)的是更高的效率,文中有非常詳細(xì)的介紹及代碼示例 ,需要的朋友可以參考下2021-05-05將python flask項(xiàng)目打包成可以運(yùn)行的軟件的全過程(包含報(bào)錯(cuò)解決)
這篇文章主要給大家介紹了將python flask項(xiàng)目打包成可以用運(yùn)行的軟件(包含報(bào)錯(cuò)解決),文中通過代碼示例和圖文結(jié)合講解的非常詳細(xì),具有一定的參考價(jià)值,需要的朋友可以參考下2024-02-02pandas基礎(chǔ)?Series與Dataframe與numpy對(duì)二進(jìn)制文件輸入輸出
這篇文章主要介紹了pandas基礎(chǔ)Series與Dataframe與numpy對(duì)二進(jìn)制文件輸入輸出,series是一種一維的數(shù)組型對(duì)象,它包含了一個(gè)值序列和一個(gè)數(shù)據(jù)標(biāo)簽2022-07-07用python實(shí)現(xiàn)一個(gè)簡(jiǎn)單的驗(yàn)證碼
這篇文章主要介紹了用python實(shí)現(xiàn)一個(gè)簡(jiǎn)單的驗(yàn)證碼的方法,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-12-12PyTorch之nn.ReLU與F.ReLU的區(qū)別介紹
這篇文章主要介紹了PyTorch之nn.ReLU與F.ReLU的區(qū)別介紹,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧2020-06-06Python內(nèi)置模塊ConfigParser實(shí)現(xiàn)配置讀寫功能的方法
這篇文章主要介紹了Python內(nèi)置模塊ConfigParser實(shí)現(xiàn)配置讀寫功能的方法,涉及Python使用ConfigParser模塊進(jìn)行配置讀、寫、修改、刪除等操作的相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下2018-02-02Python利用PyQt5制作一個(gè)獲取網(wǎng)絡(luò)實(shí)時(shí)數(shù)據(jù)NBA數(shù)據(jù)播報(bào)GUI功能
現(xiàn)在NBA聯(lián)賽也進(jìn)行到半決賽了,我們?cè)趺礃硬拍芤愿斓姆椒ǐ@取NBA的數(shù)據(jù)呢?這里我們就自己來(lái)做一個(gè)數(shù)據(jù)播報(bào)的程序2021-07-07Python中移除List重復(fù)項(xiàng)的五種方法
本文列些處幾種去除在Python 列表中(list)可能存在的重復(fù)項(xiàng),這在很多應(yīng)用程序中都會(huì)遇到的需求,本文介紹幾種方法,感興趣的可以了解一下2021-05-05