Python?Pandas中DataFrame.drop_duplicates()刪除重復(fù)值詳解
語(yǔ)法
df.drop_duplicates(subset = None,
keep = 'first',
inplace = False,
ignore_index = False)參數(shù)
1.subset:指定的標(biāo)簽或標(biāo)簽序列,僅刪除這些列重復(fù)值,默認(rèn)情況為所有列
2.keep:確定要保留的重復(fù)值,有以下可選項(xiàng):
first:保留第一次出現(xiàn)的重復(fù)值,默認(rèn)
last:保留最后一次出現(xiàn)的重復(fù)值
False:刪除所有重復(fù)值
3.inplace:是否生效
4.ignore_index:如果為True,則重新分配自然索引(0,1,…,n - 1)
# 刪除重復(fù)值 DataFrame.drop_duplicates() import pandas as pd df = pd.DataFrame([['x','x',1],['x','x',1],['z','x',2]], columns = ['A','B','C']) # 刪除重復(fù)行 res1 = df.drop_duplicates() # 刪除指定列 res2 = df.drop_duplicates(subset = ['A']) # 保留最后一個(gè) res3 = df.drop_duplicates(subset = ['A'], keep = 'last')
結(jié)果展示
df

res1

res2

res3

擴(kuò)展:識(shí)別重復(fù)值
import pandas as pd
df = pd.DataFrame({
'studentID':['A001','A002','A003','A004','A005','A006','A006'],
'score':[100,93,94,96,93,95,95]})
# 識(shí)別重復(fù)值
duplicate_value = df[df.duplicated()]df

由上圖可知studentID為'A006'的記錄有兩條,我們可以使用duplicated()方法識(shí)別重復(fù)值,它返回的是布爾值結(jié)果(True:有重復(fù)值,F(xiàn)alse:無重復(fù)值)

duplicate_value

總結(jié)
到此這篇關(guān)于Python Pandas中DataFrame.drop_duplicates()刪除重復(fù)值的文章就介紹到這了,更多相關(guān)Pandas DataFrame.drop_duplicates()刪除重復(fù)值內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python對(duì)象中__del__方法起作用的條件詳解
今天小編就為大家分享一篇Python對(duì)象中__del__方法起作用的條件詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-11-11
Python合并多個(gè)Excel數(shù)據(jù)的方法
這篇文章主要介紹了Python合并多個(gè)Excel數(shù)據(jù)的方法也就是說將多個(gè)excel中的數(shù)據(jù)合并到另一個(gè)表中,本文通過實(shí)例代碼相結(jié)合的形式給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友參考下吧2018-07-07
Python實(shí)現(xiàn)Word批量轉(zhuǎn)PDF的小工具
這篇文章主要為大家詳細(xì)介紹了如何使用Python復(fù)刻一個(gè)Word批量轉(zhuǎn)PDF的小工具,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以參考一下2025-05-05
python?包?requests?實(shí)現(xiàn)請(qǐng)求操作
這篇文章主要介紹了python?包?requests?實(shí)現(xiàn)請(qǐng)求操作,文章介紹內(nèi)容包括帶參數(shù)請(qǐng)求、自定義headers,文章內(nèi)容詳細(xì)具有一定的參考價(jià)值,需要的小伙伴可以參考一下2022-04-04
如何用定值 Cookie 實(shí)現(xiàn)反爬詳解
這篇文章主要為大家介紹了如何用定值 Cookie 實(shí)現(xiàn)反爬示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-04-04
Matplotlib之解決plt.savefig()保存多張圖片有重疊的問題
這篇文章主要介紹了Matplotlib之解決plt.savefig()保存多張圖片有重疊的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,2023-09-09

