R語言之左連接的三種實(shí)現(xiàn)操作
數(shù)據(jù)處理中經(jīng)常遇到表連接問題,本次介紹R語言中三種左連接方法,這三種是等價的,不過會有時間快慢問題,斟酌使用。
法一:
> data0 <- merge(a,c,all.x=TRUE,by='CELLPHONE')
法二:
> data1 <- sqldf('select a.*,b.* from a left join c on a.CELLPHONE=c.CELLPHONE')
法三:
> data2 <- c[a,on='CELLPHONE']
注意:第三種方法的順序不能寫反了。
補(bǔ)充:R語言中的inner_join, full_join, left_join, right_join
在R for Data Science中,作者用了非常直觀的例子解釋了上面的四個概念。說明如下:
我們的數(shù)據(jù)集是這樣的:
x <- tribble( ~key, ~val_x, 1, "x1", 2, "x2", 3, "x3" ) y <- tribble( ~key, ~val_y, 1, "y1", 2, "y2", 4, "y3" )
可以看出,x與y的key都有1,2,但是x的key里面有3,y的key里面有4.
下面我們來看這四個概念:
1. inner_join
x %>% inner_join(y, by = "key")
其結(jié)果是
key val_x val_y <dbl> <chr> <chr> 1 x1 y1 2 x2 y2
可以看出,此時基于key的連接只保留了共同的key值1與2對應(yīng)的數(shù)據(jù);
2. full_join
x %>% full_join(y, by = "key")
其結(jié)果是
key val_x val_y <dbl> <chr> <chr> 1 x1 y1 2 x2 y2 3 x3 NA 4 NA y3
可以看出,此時基于key的連接保留了所有key值對應(yīng)的數(shù)據(jù),當(dāng)相應(yīng)的值不存在的時候,用NA代替;
3. left_join
x %>% left_join(y, by = "key")
此時的結(jié)果為
<dbl> <chr> <chr> 1 x1 y1 2 x2 y2 3 x3 NA
可以看出, 此時基于key的連接只保留了x對應(yīng)的key值的數(shù)據(jù),當(dāng)相應(yīng)的值不存在的時候,用NA代替;
4. right_join
x %>% right_join(y, by = "key")
此時的結(jié)果為
key val_x val_y <dbl> <chr> <chr> 1 x1 y1 2 x2 y2 4 NA y3
可以看出,此時基于key的連接只保留了y對應(yīng)的key值的數(shù)據(jù),當(dāng)相應(yīng)的值不存在的時候,用NA代替。
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
R語言 小數(shù)點(diǎn)位數(shù)的設(shè)置方式
這篇文章主要介紹了R語言 小數(shù)點(diǎn)位數(shù)的設(shè)置方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03R語言將變量分組的3種方法實(shí)例(含cut函數(shù)說明)
在數(shù)據(jù)處理分析過程中,變量分組是經(jīng)常遇到的,下面這篇文章主要給大家介紹了關(guān)于R語言將變量分組的3種方法,其中含cut函數(shù)說明的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-08-08R語言實(shí)現(xiàn)支持向量機(jī)SVM應(yīng)用案例
本文主要介紹了R語言實(shí)現(xiàn)支持向量機(jī)SVM應(yīng)用案例,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-08-08R語言常用函數(shù)總結(jié)梳理(基本對象字符處理?數(shù)學(xué)?統(tǒng)計)
這篇文章主要介紹了R語言常用函數(shù)總結(jié)梳理(基本對象字符處理?數(shù)學(xué)?統(tǒng)計),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-10-10R語言如何畫豎線、橫線、添加標(biāo)簽以及畫固定長度的線段
R語言繪圖的能力非常強(qiáng)大,有時看似繁復(fù)的圖形不過寥寥數(shù)行代碼就搞定,下面這篇文章主要給大家介紹了關(guān)于R語言如何畫豎線、橫線、添加標(biāo)簽以及畫固定長度的線段的相關(guān)資料,需要的朋友可以參考下2022-11-11