亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python?pandas找出、刪除重復(fù)的數(shù)據(jù)實(shí)例

 更新時(shí)間:2022年07月11日 16:42:52   作者:william_cheng666  
在面試中很可能遇到給定一個(gè)含有重復(fù)元素的列表,刪除其中重復(fù)的元素,下面這篇文章主要給大家介紹了關(guān)于Python?pandas找出、刪除重復(fù)數(shù)據(jù)的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下

前言

當(dāng)我們使用pandas處理數(shù)據(jù)的時(shí)候,經(jīng)常會(huì)遇到數(shù)據(jù)重復(fù)的問題,如何找出重復(fù)數(shù)據(jù)進(jìn)而分析重復(fù)原因,或者如何直接刪除重復(fù)的數(shù)據(jù)是一個(gè)關(guān)鍵的步驟,pandas提供了很方便的方法:duplicated()和drop_duplicates()。

一、duplicated()

duplicated()可以被用在DataFrame的三種情況下,分別是pandas.DataFrame.duplicated、pandas.Series.duplicated和pandas.Index.duplicated。他們的用法都類似,前兩個(gè)會(huì)返回一個(gè)布爾值的Series,最后一個(gè)會(huì)返回一個(gè)布爾值的numpy.ndarray。

DataFrame.duplicated(subset=None, keep=‘first’)

subset:默認(rèn)為None,需要標(biāo)記重復(fù)的標(biāo)簽或標(biāo)簽序列

keep:默認(rèn)為‘first’,如何標(biāo)記重復(fù)標(biāo)簽

  • first:將除第一次出現(xiàn)以外的重復(fù)數(shù)據(jù)標(biāo)記為True
  • last:將除最后一次出現(xiàn)以外的重復(fù)數(shù)據(jù)標(biāo)記為True
  • False:將所有重復(fù)的項(xiàng)都標(biāo)記為True(不管是不是第一次出現(xiàn))

Series.duplicated(keep=‘first’)

keep:與DataFrame.duplicated的keep相同

Index.duplicated(keep=‘first’)

keep:與DataFrame.duplicated的keep相同

例子:

import pandas as pd
df = pd.DataFrame({
    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
    'rating': [4, 4, 3.5, 15, 5]
})
df

    brand style  rating
0  Yum Yum   cup     4.0
1  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0 

df.duplicated()

0    False
1     True
2    False
3    False
4    False
dtype: bool

df.duplicated(keep='last')

0     True
1    False
2    False
3    False
4    False
dtype: bool

df.duplicated(keep=False)

0     True
1     True
2    False
3    False
4    False
dtype: bool

df.duplicated(subset=['brand'])

0    False
1     True
2    False
3     True
4     True
dtype: bool

關(guān)于Index的重復(fù)標(biāo)記:

df = df.set_index('brand')
df

        style  rating
brand                
Yum Yum   cup     4.0
Yum Yum   cup     4.0
Indomie   cup     3.5
Indomie  pack    15.0
Indomie  pack     5.0

df.index.duplicated()
array([False,  True, False,  True,  True])

二、drop_duplicates()

與duplicated()類似,drop_duplicates()是直接把重復(fù)值給刪掉。下面只會(huì)介紹一些含義不同的參數(shù)。

DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)

  • subset:與duplicated()中相同
  • keep:與duplicated()中相同
  • inplace:與pandas其他函數(shù)的inplace相同,選擇是修改現(xiàn)有數(shù)據(jù)還是返回新的數(shù)據(jù)

Series.drop_duplicates()相比Series.duplicated()也是多了一個(gè)inplace參數(shù),和上訴介紹一樣,Index.drop_duplicates()與Index.duplicated()參數(shù)相同就不做贅述。下面是例子:

df = pd.DataFrame({
    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
    'rating': [4, 4, 3.5, 15, 5]
})
df

     brand style  rating
0  Yum Yum   cup     4.0
1  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0

df.drop_duplicates()

     brand style  rating
0  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0

df.drop_duplicates(inplace = True)

df

     brand style  rating
0  Yum Yum   cup     4.0
2  Indomie   cup     3.5
3  Indomie  pack    15.0
4  Indomie  pack     5.0

總結(jié)

有剩余無,pandas有很多好用的庫,但是系統(tǒng)學(xué)下來很不現(xiàn)實(shí),都是在實(shí)際項(xiàng)目中不斷的發(fā)現(xiàn)、積累、記錄下來。

到此這篇關(guān)于Python pandas找出、刪除重復(fù)數(shù)據(jù)的文章就介紹到這了,更多相關(guān)pandas找出刪除重復(fù)數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 在Python中如何使用yield

    在Python中如何使用yield

    在 Python 開發(fā)中,yield 關(guān)鍵字的使用其實(shí)較為頻繁,例如大集合的生成,簡(jiǎn)化代碼結(jié)構(gòu)、協(xié)程與并發(fā)都會(huì)用到它,文中詳細(xì)介紹了yield的用法,需要的朋友可以參考下
    2021-06-06
  • Python+Pygame實(shí)現(xiàn)經(jīng)典魂斗羅游戲

    Python+Pygame實(shí)現(xiàn)經(jīng)典魂斗羅游戲

    《魂斗羅》(Contra)是由Konami于1987年推出的一系列卷軸射擊類單機(jī)游戲。本文將利用Python中的Pygame庫實(shí)現(xiàn)這一經(jīng)典游戲,感興趣的可以了解一下
    2022-05-05
  • python?graphviz畫圖詳情

    python?graphviz畫圖詳情

    這篇文章主要介紹了python?graphviz畫圖詳情,文章圍繞graphviz畫圖的相關(guān)資料展開內(nèi)容,并附有官方安裝鏈接,需要的小伙伴可以參考一下,洗碗給對(duì)你有所幫助
    2021-12-12
  • 快速解釋如何使用pandas的inplace參數(shù)的使用

    快速解釋如何使用pandas的inplace參數(shù)的使用

    這篇文章主要介紹了快速解釋如何使用pandas的inplace參數(shù)的使用,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-07-07
  • python操作mysql實(shí)現(xiàn)一個(gè)超市管理系統(tǒng)

    python操作mysql實(shí)現(xiàn)一個(gè)超市管理系統(tǒng)

    超市管理系統(tǒng)有管理員和普通用戶兩條分支,只需掌握Python基礎(chǔ)語法,就可以完成這個(gè)項(xiàng)目,下面這篇文章主要給大家介紹了關(guān)于python操作mysql實(shí)現(xiàn)一個(gè)超市管理系統(tǒng)的相關(guān)資料,需要的朋友可以參考下
    2022-12-12
  • Python?對(duì)象拷貝及深淺拷貝區(qū)別的詳細(xì)教程示例

    Python?對(duì)象拷貝及深淺拷貝區(qū)別的詳細(xì)教程示例

    這篇文章主要介紹了Python?對(duì)象拷貝及深淺拷貝區(qū)別的詳細(xì)教程示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2023-03-03
  • 跟老齊學(xué)Python之正規(guī)地說一句話

    跟老齊學(xué)Python之正規(guī)地說一句話

    雖然在第一部分中,已經(jīng)零星涉及到語句問題,并且在不同場(chǎng)合也進(jìn)行了一些應(yīng)用。畢竟不那么系統(tǒng)。本部分,就比較系統(tǒng)地介紹python中的語句。
    2014-09-09
  • Python center()函數(shù)使用方法詳解

    Python center()函數(shù)使用方法詳解

    在python中,center()返回一個(gè)原字符居中,并默認(rèn)使用空格填充至長(zhǎng)度width返回新字符串,默認(rèn)填充字符為空格,本就將通過代碼示例給大家簡(jiǎn)單的介紹一下Python center()函數(shù)是的使用方法,感興趣的同學(xué)跟著小編一起來看看吧
    2023-07-07
  • 多場(chǎng)景下的Pandas使用技巧分享

    多場(chǎng)景下的Pandas使用技巧分享

    這篇文章主要介紹了多場(chǎng)景下的Pandas使用技巧,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-02-02
  • django settings.py 配置文件及介紹

    django settings.py 配置文件及介紹

    Django的settings文件包含Django應(yīng)用的所有配置項(xiàng)。接下來通過本文給大家介紹django settings.py 配置文件的相關(guān)知識(shí),感興趣的朋友跟隨小編一起看看吧
    2019-07-07

最新評(píng)論