pandas重復(fù)行刪除操作df.drop_duplicates和df.duplicated的區(qū)別
概念
df.duplicated()
使用df.cuplicated()來查看重復(fù)數(shù)據(jù),返回True,False,數(shù)據(jù)類型是bool.
也可以指定某一列是否有重復(fù)值df.cuplidated(‘colname’),不指定則默認(rèn)為第一列。
df.dropduplicates(’col‘,keep=‘first’,inplace=False)
用來刪除重復(fù)行。
實(shí)例
讀取數(shù)據(jù)
# %% 提取數(shù)據(jù) 從sqlite import pandas as pd from sqlalchemy import create_engine '''創(chuàng)建sqlite3連接''' eg = create_engine('sqlite:///I:/jianguoyun/Udoc/WorkDb/dataset2022.db') #創(chuàng)建數(shù)據(jù)庫連接 # 讀取數(shù)據(jù)庫文件 q_store = """ select * from pj_store20220525 """ # 讀取表 cols= ['貨號','品類','節(jié)慶','庫位','合格','換包裝','錯碼','維修','總數(shù)量' ] df = pd.read_sql(q_store,eg)[cols]
計算重復(fù)項
# df.duplicated 計算重復(fù)項 cond = df.duplicated('貨號') # 查看貨號相同的項 df.duplicated返回的是布爾值 def_line = df[cond] def_line
計算有多少個重復(fù)行
#有多少個重復(fù)行 dep_data = df.duplicated('貨號').sum() dep_data
用df.drop_duplicates提取夏季品類
# 用df.drop_duplicates提取夏季品類 df_category = df.query('節(jié)慶=="夏季"').drop_duplicates('品類',keep='last',inplace=False) df_category['品類'].sort_values()
參數(shù):
- keep ,保留最后last還是第一行first,
- inplace:是否替換原列表,false:不替換,True,替換。
到此這篇關(guān)于pandas重復(fù)行刪除操作df.drop_duplicates和df.duplicated的區(qū)別的文章就介紹到這了,更多相關(guān)pandas df.drop_duplicates df.duplicated內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Pandas去除重復(fù)項函數(shù)詳解drop_duplicates()
- Pandas之使用drop_duplicates:去除重復(fù)項
- Pandas 中的 drop_duplicates()詳解
- Python?Pandas中DataFrame.drop_duplicates()刪除重復(fù)值詳解
- pandas.DataFrame.drop_duplicates 用法介紹
- 詳解pandas使用drop_duplicates去除DataFrame重復(fù)項參數(shù)
- Pandas之drop_duplicates:去除重復(fù)項方法
- pandas的drop_duplicates無法去重問題解決
相關(guān)文章
python3連接mysql獲取ansible動態(tài)inventory腳本
Ansible Inventory 是包含靜態(tài) Inventory 和動態(tài) Inventory 兩部分的,靜態(tài) Inventory 指的是在文件中指定的主機(jī)和組,動態(tài) Inventory 指通過外部腳本獲取主機(jī)列表。這篇文章主要介紹了python3連接mysql獲取ansible動態(tài)inventory腳本,需要的朋友可以參考下2020-01-01python編程中簡潔優(yōu)雅的推導(dǎo)式示例詳解
這篇文章主要為大家介紹了python編程中簡潔優(yōu)雅的推導(dǎo)式示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-11-11解決安裝和導(dǎo)入tensorflow、keras出錯的問題
這篇文章主要介紹了解決安裝和導(dǎo)入tensorflow、keras出錯的問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-01-01python通過PyQt5實(shí)現(xiàn)登錄界面的示例代碼
本文主要介紹了python通過PyQt5實(shí)現(xiàn)登錄界面的示例代碼,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-08-08