亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Python?Pandas中DataFrame.drop_duplicates()刪除重復(fù)值詳解

 更新時(shí)間:2022年07月11日 16:10:36   作者:山茶花開時(shí)。  
在實(shí)際處理數(shù)據(jù)中,數(shù)據(jù)預(yù)處理操作中,常常需要去除掉重復(fù)的數(shù)據(jù),這篇文章主要給大家介紹了關(guān)于Python?Pandas中DataFrame.drop_duplicates()刪除重復(fù)值的相關(guān)資料,需要的朋友可以參考下

語法

df.drop_duplicates(subset = None,
                   keep = 'first', 
                   inplace = False, 
                   ignore_index = False)

參數(shù)

1.subset:指定的標(biāo)簽或標(biāo)簽序列,僅刪除這些列重復(fù)值,默認(rèn)情況為所有列

2.keep:確定要保留的重復(fù)值,有以下可選項(xiàng):

first:保留第一次出現(xiàn)的重復(fù)值,默認(rèn)

last:保留最后一次出現(xiàn)的重復(fù)值

False:刪除所有重復(fù)值

3.inplace:是否生效

4.ignore_index:如果為True,則重新分配自然索引(0,1,…,n - 1)

# 刪除重復(fù)值 DataFrame.drop_duplicates()
import pandas as pd
 
df = pd.DataFrame([['x','x',1],['x','x',1],['z','x',2]], columns = ['A','B','C'])
 
# 刪除重復(fù)行
res1 = df.drop_duplicates()
 
# 刪除指定列
res2 = df.drop_duplicates(subset = ['A'])
 
# 保留最后一個(gè)
res3 = df.drop_duplicates(subset = ['A'], keep = 'last')

結(jié)果展示

df

res1

res2

res3

擴(kuò)展:識(shí)別重復(fù)值

import pandas as pd
 
df = pd.DataFrame({
    'studentID':['A001','A002','A003','A004','A005','A006','A006'],
    'score':[100,93,94,96,93,95,95]})
 
# 識(shí)別重復(fù)值
duplicate_value = df[df.duplicated()]

df

由上圖可知studentID為'A006'的記錄有兩條,我們可以使用duplicated()方法識(shí)別重復(fù)值,它返回的是布爾值結(jié)果(True:有重復(fù)值,F(xiàn)alse:無重復(fù)值)

duplicate_value

總結(jié)

到此這篇關(guān)于Python Pandas中DataFrame.drop_duplicates()刪除重復(fù)值的文章就介紹到這了,更多相關(guān)Pandas DataFrame.drop_duplicates()刪除重復(fù)值內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論