Python數(shù)據(jù)處理中pd.concat與pd.merge的區(qū)別及說(shuō)明
背景
數(shù)據(jù)的合并與關(guān)聯(lián)是數(shù)據(jù)處理過(guò)程中經(jīng)常遇到的問(wèn)題,在SQL、HQL中大家可能都有用到 join、uion all 等 ,在 Pandas 中也有同樣的功能,來(lái)滿足數(shù)據(jù)處理需求,個(gè)人感覺(jué)Pandas 處理數(shù)據(jù)還是非常方便,數(shù)據(jù)處理效率比較高,能滿足不同的業(yè)務(wù)需求
本篇文章主要介紹 Pandas 中的數(shù)據(jù)拼接與關(guān)聯(lián)
數(shù)據(jù)拼接---pd.concat
concat 是pandas級(jí)的函數(shù),用來(lái)拼接或合并數(shù)據(jù),其根據(jù)不同的軸既可以橫向拼接,又可以縱向拼接
函數(shù)參數(shù):
pd.concat( objs: 'Iterable[NDFrame] | Mapping[Hashable, NDFrame]', axis=0, join='outer', ignore_index: 'bool' = False, keys=None, levels=None, names=None, verify_integrity: 'bool' = False, sort: 'bool' = False, copy: 'bool' = True, ) -> 'FrameOrSeriesUnion'
objs
:合并的數(shù)據(jù)集,一般用列表傳入,例如:[df1,df2,df3]axis
:指定數(shù)據(jù)拼接時(shí)的軸,0是行,在行方向上拼接;1是列,在列方向上拼接join
:拼接的方式有 inner,或者outer,與sql中的意思一樣
以上三個(gè)參數(shù)在實(shí)際工作中經(jīng)常使用,其他參數(shù)不再做介紹
案例:
模擬數(shù)據(jù)
- 橫向拼接
橫向拼接-1
字段相同的列進(jìn)行堆疊,字段不同的列分列存放,缺失值用NAN
來(lái)填充,下面對(duì)模擬數(shù)據(jù)進(jìn)行變換用相同的字段,進(jìn)行演示
橫向拼接-2
- 縱向拼接
縱向拼接
可以看出在縱向拼接的時(shí)候,會(huì)按索引進(jìn)行關(guān)聯(lián),使相同名字的成績(jī)放在一起,而不是簡(jiǎn)單的堆疊
數(shù)據(jù)關(guān)聯(lián)---pd.merge
數(shù)據(jù)聯(lián)接,與SQL中的join基本一樣,用來(lái)關(guān)聯(lián)不同的數(shù)據(jù)表,有左表、右表的區(qū)分,可以指定關(guān)聯(lián)的字段
函數(shù)參數(shù):
pd.merge( left: 'DataFrame | Series', right: 'DataFrame | Series', how: 'str' = 'inner', on: 'IndexLabel | None' = None, left_on: 'IndexLabel | None' = None, right_on: 'IndexLabel | None' = None, left_index: 'bool' = False, right_index: 'bool' = False, sort: 'bool' = False, suffixes: 'Suffixes' = ('_x', '_y'), copy: 'bool' = True, indicator: 'bool' = False, validate: 'str | None' = None, ) -> 'DataFrame'
left
:左表right
:右表how
:關(guān)聯(lián)的方式,{'left', 'right', 'outer', 'inner', 'cross'}, 默認(rèn)關(guān)聯(lián)方式為 'inner'on
:關(guān)聯(lián)時(shí)指定的字段,兩個(gè)表共有的left_on
:關(guān)聯(lián)時(shí)用到左表中的字段,在兩個(gè)表不共有關(guān)聯(lián)字段時(shí)使用right_on
:關(guān)聯(lián)時(shí)用到右表中的字段,在兩個(gè)表不共有關(guān)聯(lián)字段時(shí)使用
以上參數(shù)在實(shí)際工作中經(jīng)常使用,其他參數(shù)不再做介紹
案例:
數(shù)據(jù)關(guān)聯(lián)
merge 的使用與SQL中的 join 很像,使用方式基本一致,既有內(nèi)連接,也有外連接,用起來(lái)基本沒(méi)有什么難度
兩者區(qū)別
concat
只是 pandas 下的方法,而 merge 即是 pandas 下的方法,又是DataFrame 下的方法concat
可以橫向、縱向拼接,又起到關(guān)聯(lián)的作用merge
只能進(jìn)行關(guān)聯(lián),也就是縱向拼接concat
可以同時(shí)處理多個(gè)數(shù)據(jù)框DataFrame,而 merge 只能同時(shí)處理 2 個(gè)數(shù)據(jù)框
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python使用PyQt5實(shí)現(xiàn)與DeepSeek聊天的圖形化小軟件
在?PyQt5?中,菜單欄(QMenuBar)、工具欄(QToolBar)和狀態(tài)欄(QStatusBar)是?QMainWindow?提供的標(biāo)準(zhǔn)控件,用于幫助用戶更好地與應(yīng)用程序交互,所以本文給大家介紹了Python使用PyQt5實(shí)現(xiàn)與DeepSeek聊天的圖形化小軟件,需要的朋友可以參考下2025-03-03Python代碼實(shí)現(xiàn)一個(gè)AI多站點(diǎn)搜索神器
在人工智能快速發(fā)展的今天,我們經(jīng)常需要在多個(gè)AI平臺(tái)上嘗試同一個(gè)提示詞,每次復(fù)制粘貼真的很麻煩,所以本文就來(lái)使用Python打造一個(gè)AI多站點(diǎn)搜索神器吧2025-03-03Python實(shí)現(xiàn)Selenium自動(dòng)化Page模式
這篇文章主要介紹了Python實(shí)現(xiàn)Selenium自動(dòng)化Page模式,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07numpy.ndarray 交換多維數(shù)組(矩陣)的行/列方法
今天小編就為大家分享一篇numpy.ndarray 交換多維數(shù)組(矩陣)的行/列方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-08-08python連接mongodb密碼認(rèn)證實(shí)例
今天小編就為大家分享一篇python連接mongodb密碼認(rèn)證實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-10-10Python實(shí)現(xiàn)對(duì)Excel表格的操作詳解
這篇文章主要介紹了Python實(shí)現(xiàn)對(duì)Excel表格的操作,在數(shù)據(jù)處理和報(bào)告生成等工作中,Excel表格是一種常見(jiàn)且廣泛使用的工具,使用Python來(lái)處理Excel表格能夠大大的提升效率,感興趣的同學(xué)可以參考下2024-02-02