Pandas中兩個(gè)dataframe的交集和差集的示例代碼
創(chuàng)建測試數(shù)據(jù):
import pandas as pd
import numpy as np
#Create a DataFrame
df1 = {
'Subject':['semester1','semester2','semester3','semester4','semester1',
'semester2','semester3'],
'Score':[62,47,55,74,31,77,85]}
df2 = {
'Subject':['semester1','semester2','semester3','semester4'],
'Score':[90,47,85,74]}
df1 = pd.DataFrame(df1,columns=['Subject','Score'])
df2 = pd.DataFrame(df2,columns=['Subject','Score'])
print(df1)
print(df2)
運(yùn)行結(jié)果:

求兩個(gè)dataframe的交集
intersected_df = pd.merge(df1, df2, how='inner') print(intersected_df)

也可以指定求交集的列:
intersected_df = pd.merge(df1, df2, on=['Subject'], how='inner') print(intersected_df)

求差集
df2-df1:
set_diff_df = pd.concat([df2, df1, df1]).drop_duplicates(keep=False) print(set_diff_df)

df1-df2:
set_diff_df = pd.concat([df1, df2, df2]).drop_duplicates(keep=False) print(set_diff_df)

另一種求差集的方法是:
以df1-df2為例:
df1 = df1.append(df2) df1 = df1.append(df2) set_diff_df = df1.drop_duplicates(subset=['Subject', 'Score'],keep=False) print(set_diff_df)
得到的df1-df2結(jié)果是一樣的:

到此這篇關(guān)于Pandas中兩個(gè)dataframe的交集和差集的示例代碼的文章就介紹到這了,更多相關(guān)Pandas dataframe交集差集內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python爬蟲 urllib模塊反爬蟲機(jī)制UA詳解
這篇文章主要介紹了python爬蟲 urllib模塊反爬蟲機(jī)制UA詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-08-08
python 圖像判斷,清晰度(明暗),彩色與黑白實(shí)例
這篇文章主要介紹了python 圖像判斷,清晰度(明暗),彩色與黑白實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06
python GUI庫圖形界面開發(fā)之PyQt5菜單欄控件QMenuBar的詳細(xì)使用方法與實(shí)例
這篇文章主要介紹了python GUI庫圖形界面開發(fā)之PyQt5菜單欄控件QMenuBar的詳細(xì)使用方法與實(shí)例,需要的朋友可以參考下2020-02-02
Python matplotlib畫圖與中文設(shè)置操作實(shí)例分析
這篇文章主要介紹了Python matplotlib畫圖與中文設(shè)置操作,結(jié)合實(shí)例形式分析了Python使用matplotlib進(jìn)行圖形繪制及中文設(shè)置相關(guān)操作技巧,需要的朋友可以參考下2019-04-04

