亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python數(shù)據(jù)分析的八種處理缺失值方法詳解

 更新時(shí)間:2021年11月18日 11:47:11   作者:Python學(xué)習(xí)與數(shù)據(jù)挖掘  
缺失值可能是數(shù)據(jù)科學(xué)中最不受歡迎的值,然而,它們總是在身邊。忽略缺失值也是不合理的,因此我們需要找到有效且適當(dāng)?shù)靥幚硭鼈兊姆椒?/div>

在本文中,我們將介紹 8 種不同的方法來解決缺失值問題,哪種方法最適合特定情況取決于數(shù)據(jù)和任務(wù)。歡迎收藏學(xué)習(xí),喜歡點(diǎn)贊支持,技術(shù)交流可以文末加群,盡情暢聊。

讓我們首先創(chuàng)建一個(gè)示例數(shù)據(jù)框并向其中添加一些缺失值。

在這里插入圖片描述

在這里插入圖片描述

我們有一個(gè) 10 行 6 列的數(shù)據(jù)框。

下一步是添加缺失值。 我們將使用 loc 方法選擇行和列組合,并使它們等于“np.nan”,這是標(biāo)準(zhǔn)缺失值表示之一。

在這里插入圖片描述

這是數(shù)據(jù)框現(xiàn)在的樣子:

在這里插入圖片描述

item 和 measure 1 列具有整數(shù)值,但由于缺少值,它們已被向上轉(zhuǎn)換為浮點(diǎn)數(shù)。

在 Pandas 1.0 中,引入了整數(shù)類型缺失值表示 (),因此我們也可以在整數(shù)列中包含缺失值。 但是,我們需要顯式聲明數(shù)據(jù)類型。

在這里插入圖片描述

在這里插入圖片描述

盡管有缺失值,我們現(xiàn)在可以保留整數(shù)列。

現(xiàn)在我們有一個(gè)包含一些缺失值的數(shù)據(jù)框。 是時(shí)候看看處理它們的不同方法了。

1. 刪除有缺失值的行或列

一種選擇是刪除包含缺失值的行或列。

在這里插入圖片描述

在這里插入圖片描述

使用默認(rèn)參數(shù)值,dropna 函數(shù)會(huì)刪除包含任何缺失值的行。數(shù)據(jù)框中只有一行沒有任何缺失值。同時(shí)我們還可以選擇使用軸參數(shù)刪除至少有一個(gè)缺失值的列。

在這里插入圖片描述

2. 刪除只有缺失值的行或列

另一種情況是有一列或一行充滿缺失值。 這樣的列或行是無用的,所以我們可以刪除它們。

dropna 函數(shù)也可以用于此目的。 我們只需要改變 how 參數(shù)的值。

在這里插入圖片描述

3. 根據(jù)閾值刪除行或列

基于“any”或“all”的刪除并不總是最好的選擇。 我們有時(shí)需要?jiǎng)h除具有“大量”或“一些”缺失值的行或列。

我們不能將這樣的表達(dá)式分配給 how 參數(shù),但 Pandas 為我們提供了一種更準(zhǔn)確的方法,即 thresh 參數(shù)。

例如,“thresh=4”意味著至少有 4 個(gè)非缺失值的行將被保留。 其他的將被丟棄。

我們的數(shù)據(jù)框有 6 列,因此將刪除具有 3 個(gè)或更多缺失值的行。

在這里插入圖片描述

在這里插入圖片描述

只有第三行有 2 個(gè)以上的缺失值,所以它是唯一一個(gè)被丟棄的。

4. 基于特定的列子集刪除

在刪除列時(shí),我們可以只考慮部分列。

dropna 函數(shù)的子集參數(shù)用于此任務(wù)。 例如,我們可以刪除在度量 1 或度量 2 列中有缺失值的行,如下所示:

在這里插入圖片描述

在這里插入圖片描述

到目前為止,我們已經(jīng)看到了根據(jù)缺失值刪除行或列的不同方法。放棄并不是唯一的選擇。 在某些情況下,我們可能會(huì)選擇填充缺失值而不是刪除它們。

事實(shí)上,填充可能是更好的選擇,因?yàn)閿?shù)據(jù)意味著價(jià)值。 如何填補(bǔ)缺失值,當(dāng)然取決于數(shù)據(jù)的結(jié)構(gòu)和任務(wù)。

fillna 函數(shù)用于填充缺失值。

5. 填充一個(gè)常數(shù)值

我們可以選擇一個(gè)常量值來替代缺失值。如果我們只給 fillna 函數(shù)一個(gè)常量值,它將用該值替換數(shù)據(jù)框中的所有缺失值。

更合理的方法是為不同的列確定單獨(dú)的常量值。 我們可以將它們寫入字典并將其傳遞給 values 參數(shù)。

在這里插入圖片描述

在這里插入圖片描述

item 列中的缺失值替換為 1014,而 measure 1 列中的缺失值替換為 0。

6. 填充聚合值

另一種選擇是使用聚合值,例如平均值、中位數(shù)或眾數(shù)。

下面這行代碼用該列的平均值替換了第 2 列中的缺失值。

在這里插入圖片描述

7. 替換為上一個(gè)或下一個(gè)值

可以用該列中的前一個(gè)或下一個(gè)值替換該列中的缺失值。在處理時(shí)間序列數(shù)據(jù)時(shí),此方法可能會(huì)派上用場。 假設(shè)您有一個(gè)包含每日溫度測(cè)量值的數(shù)據(jù)框,但缺少一天的溫帶。 最佳解決方案是使用第二天或前一天的溫度。

fillna 函數(shù)的方法參數(shù)用于執(zhí)行此任務(wù)。

在這里插入圖片描述

在這里插入圖片描述

“bfill”向后填充缺失值,以便將它們替換為下一個(gè)值??纯醋詈笠粰?。 缺失值被替換到第一行。 這可能不適合某些情況。

值得慶幸的是,我們可以限制用這種方法替換的缺失值的數(shù)量。 如果我們將 limit 參數(shù)設(shè)置為 1,那么一個(gè)缺失值只能用它的下一個(gè)值替換。 后面的第二個(gè)或第三個(gè)值將不會(huì)用于替換。

8. 使用另一個(gè)數(shù)據(jù)框填充

我們還可以將另一個(gè)數(shù)據(jù)幀傳遞給 fillna 函數(shù)。 新數(shù)據(jù)框中的值將用于替換當(dāng)前數(shù)據(jù)框中的缺失值。

將根據(jù)行索引和列名稱選擇值。 例如,如果 item 列的第二行中存在缺失值,則將使用新數(shù)據(jù)框中相同位置的值。

在這里插入圖片描述

在這里插入圖片描述

以上是具有相同列的兩個(gè)數(shù)據(jù)框。 第一個(gè) 沒有任何缺失值。

我們可以使用 fillna 函數(shù)如下:

在這里插入圖片描述

df 中的值將替換為 df2 中關(guān)于列名和行索引的值。

總結(jié)

缺失將永遠(yuǎn)存在于我們的生活中。 沒有最好的方法來處理它們,但我們可以通過應(yīng)用準(zhǔn)確合理的方法來降低它們的影響。我們已經(jīng)介紹了 8 種不同的處理缺失值的方法,使用哪一個(gè)取決于數(shù)據(jù)和任務(wù)。

技術(shù)交流

歡迎轉(zhuǎn)載、收藏、有所收獲點(diǎn)贊支持一下!

在這里插入圖片描述

到此這篇關(guān)于Python數(shù)據(jù)分析的八種處理缺失值方法詳解的文章就介紹到這了,更多相關(guān)Python 數(shù)據(jù)分析內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 淺談python量化 雙均線策略(金叉死叉)

    淺談python量化 雙均線策略(金叉死叉)

    這篇文章主要介紹了淺談python量化 雙均線策略(金叉死叉),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • Python OpenCV之圖片縮放的實(shí)現(xiàn)(cv2.resize)

    Python OpenCV之圖片縮放的實(shí)現(xiàn)(cv2.resize)

    這篇文章主要介紹了Python OpenCV之圖片縮放的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-06-06
  • PyQt5 在label顯示的圖片中繪制矩形的方法

    PyQt5 在label顯示的圖片中繪制矩形的方法

    今天小編就為大家分享一篇PyQt5 在label顯示的圖片中繪制矩形的方法,具有很好的參考價(jià)值。希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2019-06-06
  • Python中使用第三方庫xlrd來讀取Excel示例

    Python中使用第三方庫xlrd來讀取Excel示例

    這篇文章主要介紹了Python中使用第三方庫xlrd來讀取Excel示例,本文講解了安裝xlrd、xlrd的API、使用xlrd讀取Excel代碼示例,需要的朋友可以參考下
    2015-04-04
  • 如何用Python一次性下載抖音上音樂

    如何用Python一次性下載抖音上音樂

    不知道什么時(shí)候開始,中國出現(xiàn)了南抖音、北快手的互文格局。喜歡抖音主要是兩個(gè)初衷,學(xué)做菜聽音樂。抖音捧紅了很多人,也讓很多本不怎么讓大家熟知的歌曲、BGM,經(jīng)過翻唱、混剪與視頻搭配,從而傳播大街小巷。有沒有想過將這些好聽的剪輯批量下載下來呢?
    2021-05-05
  • Python爬取京東商品信息評(píng)論存并進(jìn)MySQL

    Python爬取京東商品信息評(píng)論存并進(jìn)MySQL

    這篇文章主要介紹了Python爬取京東商品信息評(píng)論存并進(jìn)MySQL,文章通過構(gòu)建mysql數(shù)據(jù)表展開Python爬取信息存進(jìn)MySQL的內(nèi)容,需要的小伙伴可以參考一下
    2022-04-04
  • python數(shù)組排序方法之sort、sorted和argsort詳解

    python數(shù)組排序方法之sort、sorted和argsort詳解

    這篇文章主要給大家介紹了關(guān)于python數(shù)組排序方法之sort、sorted和argsort的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2022-03-03
  • Python備份Mysql腳本

    Python備份Mysql腳本

    特點(diǎn)是多平臺(tái),一個(gè)腳本內(nèi)可以備份多個(gè)數(shù)據(jù)庫,并分別打包上傳到ftp進(jìn)行備份。調(diào)用了mysqldump及tar來進(jìn)行數(shù)據(jù)庫dump及打包。 具體參數(shù)說明參見源文件
    2008-08-08
  • python爬蟲用scrapy獲取影片的實(shí)例分析

    python爬蟲用scrapy獲取影片的實(shí)例分析

    在本篇內(nèi)容里小編給大家整理的是一篇關(guān)于python爬蟲用scrapy獲取影片的實(shí)例分析內(nèi)容,有興趣的朋友們可以參考下。
    2020-11-11
  • 深入理解python?生成器、迭代器、動(dòng)態(tài)新增屬性及方法

    深入理解python?生成器、迭代器、動(dòng)態(tài)新增屬性及方法

    這篇文章主要介紹了python?生成器、迭代器、動(dòng)態(tài)新增屬性及方法,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2023-04-04

最新評(píng)論