pandas取出重復數據的方法
更新時間:2019年07月04日 11:02:18 作者:到你了,弟弟
今天小編就為大家分享一篇pandas取出重復數據的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
drop_duplicates為我們提供了數據去重的方法,那怎么得到哪些數據有重復呢?
實現步驟:
1、采用drop_duplicates對數據去兩次重,一次將重復數據全部去除(keep=False)記為data1,另一次將重復數據保留一個(keep='first)記為data2;
2、求data1和data2的差集即可:data2.append(data1).drop_duplicates(keep=False)
以上這篇pandas取出重復數據的方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
您可能感興趣的文章:
相關文章
Python實現的大數據分析操作系統(tǒng)日志功能示例
這篇文章主要介紹了Python實現的大數據分析操作系統(tǒng)日志功能,涉及Python大文件切分、讀取、多線程操作等相關使用技巧,需要的朋友可以參考下2019-02-02python 代碼實現k-means聚類分析的思路(不使用現成聚類庫)
這篇文章主要介紹了python 代碼實現k-means聚類分析(不使用現成聚類庫),本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-06-06