亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

pandas的空數(shù)據(jù)處理方式

 更新時間:2024年09月12日 12:30:10   作者:Enzo?想砸電腦  
數(shù)據(jù)清洗是關鍵步驟,尤其是處理空數(shù)據(jù),Pandas提供.isna()識別、.dropna()刪除和填充函數(shù)(如使用平均值、中位數(shù)或眾數(shù))來處理數(shù)據(jù)集中的空值,以提高數(shù)據(jù)分析的準確性,有效的空數(shù)據(jù)處理可以確保數(shù)據(jù)集的完整性和可靠性

pandas空數(shù)據(jù)處理

數(shù)據(jù)清洗是對一些沒有用的數(shù)據(jù)進行處理的過程。

很多數(shù)據(jù)集存在數(shù)據(jù)缺失、數(shù)據(jù)格式錯誤、錯誤數(shù)據(jù)或重復數(shù)據(jù)的情況,如果要使數(shù)據(jù)分析更加準確,就需要對這些沒有用的數(shù)據(jù)進行處理。

數(shù)據(jù)準備

import pandas as pd

data = pd.read_csv(r'../input/pandas/property-data.csv')
data

1、判斷空值 .isna()

data.isna()

對比可以看出:Pandas 把 NaN 當作空數(shù)據(jù),na 和 – 不是空數(shù)據(jù)

我們可以在讀取數(shù)據(jù)的時候,指定哪些屬于空數(shù)據(jù)

data = pd.read_csv('../input/pandas/property-data.csv', na_values = ["NaN", "na", "--"])
data.isna()

#  統(tǒng)計每個特征的空值的數(shù)量,再按照空值數(shù)量降序排列
data.isna().sum().sort_values(ascending=False)

2、空值刪除 .dropna()

如果我們要刪除包含空字段的行,可以使用 dropna() 方法,語法格式如下

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

參數(shù)說明:

  • axis:默認為 0,表示逢空值剔除整行,如果設置參數(shù) axis=1 表示逢空值去掉整列。
  • how:默認為 ‘any’ ,如果一行(或一列)里任何一個數(shù)據(jù)有出現(xiàn) NA 就去掉整行,如果設置 how=‘all’ , 一行(或列)都是 NA 才去掉這整行。
  • thresh:設置需要多少非空值的數(shù)據(jù)才可以保留下來的。
  • subset:設置想要檢查的列。如果是多個列,可以使用列名的 list 作為參數(shù)。
  • inplace:如果設置 True,將計算得到的值直接覆蓋之前的值并返回 None,修改的是源數(shù)據(jù)。

假設我們要刪掉 ‘ST_NUM’ 和 ‘NUM_BEDROOMS’ 中有空值的行, 并且直接在原數(shù)據(jù)里面刪 ( inplace=True )

data.dropna(subset=['ST_NUM', 'NUM_BEDROOMS'], inplace=True)
data

3、空值替換 .dropna()

data['NUM_BEDROOMS'].fillna('0.0', inplace = True)
data

除了直接指定常數(shù)替換,常用的替換空單元格的方法是計算列的均值(mean:所有值加起來的平均值)、中位數(shù)值(median 排序后排在中間的數(shù))或眾數(shù)(mode 出現(xiàn)頻率最高的數(shù))。

1) 用平均值填充

x = data["ST_NUM"].mean()
data["ST_NUM"].fillna(x, inplace = True)
data

2) 用中位數(shù)填充

```python
x = data["ST_NUM"].median()
data["ST_NUM"].fillna(x, inplace = True)
data

3) 用眾數(shù)填充

x = data["ST_NUM"].mode()
data["ST_NUM"].fillna(x, inplace = True)
data

總結

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關文章

  • Python爬蟲框架scrapy實現(xiàn)的文件下載功能示例

    Python爬蟲框架scrapy實現(xiàn)的文件下載功能示例

    這篇文章主要介紹了Python爬蟲框架scrapy實現(xiàn)的文件下載功能,結合實例形式分析了scrapy框架進行文件下載的具體操作步驟與相關實現(xiàn)技巧,需要的朋友可以參考下
    2018-08-08
  • Python實現(xiàn)炸金花游戲的示例代碼

    Python實現(xiàn)炸金花游戲的示例代碼

    本文主要介紹了Python實現(xiàn)炸金花游戲的示例代碼,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-01-01
  • Python機器學習從ResNet到DenseNet示例詳解

    Python機器學習從ResNet到DenseNet示例詳解

    ResNet極大地改變了如何參數(shù)化深層網(wǎng)絡中函數(shù)的觀點。稠密連接網(wǎng)絡(DenseNet)在某種程度上是ResNet的邏輯擴展。讓我們先從數(shù)學上了解下
    2021-10-10
  • Python學習之yaml文件的讀取詳解

    Python學習之yaml文件的讀取詳解

    yaml其實也類似于 json、txt ,它們都屬于一種文本格式。在我們的實際工作中, yaml 文件經(jīng)常作為服務期配置文件來使用。本文將為大家介紹一些Python讀取yaml文件的方法,需要的可以參考一下
    2022-03-03
  • PyQt5+PyQt5Designer的安裝步驟

    PyQt5+PyQt5Designer的安裝步驟

    本文主要介紹了PyQt5+PyQt5Designer的安裝步驟,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2023-01-01
  • 六個Python編程最受用的內(nèi)置函數(shù)使用詳解

    六個Python編程最受用的內(nèi)置函數(shù)使用詳解

    在日常的python編程中使用這幾個函數(shù)來簡化我們的編程工作,經(jīng)常使用能使編程效率大大地提高。本文為大家總結了六個Python編程最受用的內(nèi)置函數(shù),感興趣的可以了解一下
    2022-07-07
  • Python?Watchdog實現(xiàn)實時監(jiān)控文件系統(tǒng)

    Python?Watchdog實現(xiàn)實時監(jiān)控文件系統(tǒng)

    Python?Watchdog是一個優(yōu)秀的第三方庫,用于實現(xiàn)高效的文件系統(tǒng)監(jiān)控,本文將為大家詳細介紹一下Python如何使用Watchdog實現(xiàn)實時監(jiān)控文件,需要的可以參考下
    2023-11-11
  • python字典排序實例詳解

    python字典排序實例詳解

    這篇文章主要介紹了python字典排序實現(xiàn)方法,實例分析了Python字典排序的相關技巧,需要的朋友可以參考下
    2015-05-05
  • Python爬蟲獲取基金凈值信息詳情

    Python爬蟲獲取基金凈值信息詳情

    這篇文章主要介紹了Python爬蟲獲取基金凈值信息詳情,文章基于錢兩篇文章的內(nèi)容圍繞python的相關資料展開詳細介紹,需要的小伙伴可以參考一下
    2022-05-05
  • python導入導出redis數(shù)據(jù)的實現(xiàn)

    python導入導出redis數(shù)據(jù)的實現(xiàn)

    本文主要介紹了python導入導出redis數(shù)據(jù)的實現(xiàn),文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-02-02

最新評論