R語言中do.call()的使用說明
簡單參數(shù)設(shè)置就能搞定的事情,是不會(huì)用到do.call的。
在運(yùn)用R的過程中總會(huì)碰到這樣一類函數(shù),它們接受的參數(shù)數(shù)量可以是任意的,該函數(shù)會(huì)處理這些參數(shù),并返回處理結(jié)果。
最簡單的例子就是data.frame
比如:
> x1 = 1:10 > x2 = 11:20 > x3 = 21:30 > data.frame(x1,x2,x3) x1 x2 x3 1 1 11 21 2 2 12 22 3 3 13 23 4 4 14 24 5 5 15 25 6 6 16 26 7 7 17 27 8 8 18 28 9 9 19 29 10 10 20 30
你可以在data.frame函數(shù)中加入任意多的向量參數(shù)(x1,x2,x3都是向量)。
不過現(xiàn)在的情況是:你明確知道你僅將這三個(gè)向量拼湊成一個(gè)數(shù)據(jù)框就行了,那么,你寫成data.frame(x1,x2,x3)是最好的方法,沒必要寫成如下的方式:
> do.call("data.frame",list(x1,x2,x3)) X1.10 X11.20 X21.30 1 1 11 21 2 2 12 22 3 3 13 23 4 4 14 24 5 5 15 25 6 6 16 26 7 7 17 27 8 8 18 28 9 9 19 29 10 10 20 30
不過,假設(shè)你遇到的情況是這樣:你現(xiàn)在需要從磁盤上的某個(gè)文件中讀入所有行次的數(shù)據(jù),但是隨情況變化,文件的長度會(huì)發(fā)生改變。
可是你打算編寫一個(gè)能同時(shí)應(yīng)對各種長度文件的程序,程序目的是將文件中各行的內(nèi)容豎過來,按列組成一個(gè)數(shù)據(jù)框。
那么請問你有哪些方法?——read.table()+t(),好吧,我承認(rèn)我又輸了,看來do.call還不是最好的選項(xiàng)。
那么如果這個(gè)文件各行的類型不同呢?比如一行字符,一行數(shù)字,一行布爾值,如此循環(huán)延伸,你又能怎么辦?
f = file("abc.txt", "r") n = length(count.fields("abc.txt")) / 3 l = list() for (i in 1:n) { l[[(i-1)*3 + 1]] = scan(file = f, sep = ",", nlines = 1, what = "", quiet = TRUE) l[[(i-1)*3 + 2]] = scan(file = f, sep = ",", nlines = 1, what = 0, quiet = TRUE) l[[(i-1)*3 + 3]] = scan(file = f, sep = ",", nlines = 1, what = TRUE, quiet = TRUE) } names(l) = paste("l", 1:length(l), sep = "") r = do.call("data.frame", l) print(r)
仍然有替代方案:
(1)我就用read.table()+t(),大不了事后再按列轉(zhuǎn)換類型!
(2)仍然是上述循環(huán),我不要每次都把值押入list中,我直接創(chuàng)建data.frame,之后再用cbind()逐列添加,這樣就用不著do.call了
那么現(xiàn)在再次提高難度:取消轉(zhuǎn)置函數(shù)t()的使用,不允許使用cbind()函數(shù)。那么你只能用do.call了。
我其實(shí)一點(diǎn)都不蠻橫,只要換一種情境即可——ffbase包,專門處理大數(shù)據(jù)的擴(kuò)展包,其中ffdf對象與data.frame類似(不過可容納更多數(shù)據(jù)),但不容易增添新列,且無法轉(zhuǎn)置!ffdf函數(shù)是什么你不需要知道,你只要知道它也可以添加任意多的參數(shù)即可。
好吧,下面就是一個(gè)涉及ffbase包的程序片段
來感受一下do.call的用法吧:
addStrategyData <- function(detailList, index) { a = list() x = detailList[[index]] vMode = sapply(names(x), function(y) switch(y, "s" = "integer", "t" = "double", "f" = "logical")) names(vMode) = names(x) x = as.ffdf(x, vmode = vMode) for (i in 1:ncol(x)) a[[i]] = x[[i]] for (i in (length(a) + 1:length(detailList))) a[[i]] = ff(FALSE, length = nrow(x), vmode = "logical") a[[ncol(x) + index]] = ff(TRUE, length = nrow(x), vmode = "logical") names(a) = c(names(x), paste("S", 1:length(detailList), sep = "")) return(do.call("ffdf", a)) }
某些情況下,你知道某個(gè)函數(shù)接受參數(shù)的明確個(gè)數(shù),但是太多了,你懶,所以用do.call;但更多的情況是你迫不得已,必須用它。
補(bǔ)充:R中的LAPPLY和DO.CALL有什么區(qū)別?
最近我在學(xué)習(xí)R,兩個(gè)函數(shù)lapply和do.call混淆了。 看起來,它們和Lisp中的map函數(shù)類似。 但是為什么有兩個(gè)不同的名字呢? 為什么R不使用稱為map的函數(shù)?
有一個(gè)稱為Map的function,可能與其他語言的地圖類似:
lapply
返回與X相同長度的列表,其中每個(gè)元素都是將FUN應(yīng)用于X的對應(yīng)元素的結(jié)果。
do.call
構(gòu)造并執(zhí)行一個(gè)函數(shù)調(diào)用,從一個(gè)名字或一個(gè)函數(shù)和一個(gè)參數(shù)列表傳遞給它。
Map將一個(gè)函數(shù)應(yīng)用到給定vector的相應(yīng)元素… Map是一個(gè)簡單的mapply包裝,它不會(huì)試圖簡化結(jié)果,類似于Common Lisp的mapcar(但是參數(shù)被回收)。 未來的版本可能允許對結(jié)果types進(jìn)行一些控制。
1、Map是mapply的包裝
2、lapply是mapply
3、因此在許多情況下Map和lapply將是相似的。
例如,這里是lapply :
lapply(iris, class) $Sepal.Length [1] "numeric" $Sepal.Width [1] "numeric" $Petal.Length [1] "numeric" $Petal.Width [1] "numeric" $Species [1] "factor"
和使用Map :
Map(class, iris) $Sepal.Length [1] "numeric" $Sepal.Width [1] "numeric" $Petal.Length [1] "numeric" $Petal.Width [1] "numeric" $Species [1] "factor"
do.call采用一個(gè)函數(shù)作為input,并將其他參數(shù)潑到函數(shù)上。 例如,它被廣泛用于將列表組裝成更簡單的結(jié)構(gòu)(通常使用rbind或cbind )。
例如:
x <- lapply(iris, class) do.call(c, x) Sepal.Length Sepal.Width Petal.Length Petal.Width Species "numeric" "numeric" "numeric" "numeric" "factor"
lapply在列表上應(yīng)用一個(gè)函數(shù), do.call用參數(shù)列表調(diào)用一個(gè)函數(shù)。 這對我來說看起來很不一樣
用列表舉個(gè)例子:
X <- list(1:3,4:6,7:9)
用lapply你可以得到列表中每個(gè)元素的意思:
> lapply(X,mean) [[1]] [1] 2 [[2]] [1] 5 [[3]] [1] 8
do.call給出一個(gè)錯(cuò)誤,正如意味著參數(shù)“trim”為1。
另一方面, rbind綁定所有參數(shù)。 所以綁定X行,你做:
> do.call(rbind,X) [,1] [,2] [,3] [1,] 1 2 3 [2,] 4 5 6 [3,] 7 8 9
如果你使用lapply ,R會(huì)將rbind應(yīng)用于列表中的每一個(gè)元素,給你這個(gè)廢話:
> lapply(X,rbind) [[1]] [,1] [,2] [,3] [1,] 1 2 3 [[2]] [,1] [,2] [,3] [1,] 4 5 6 [[3]] [,1] [,2] [,3] [1,] 7 8 9
要有像Map這樣的東西,你需要?mapply ,這是完全不同的東西。 為了得到例如X中每個(gè)元素的平均值,但是使用不同的修整,可以使用:
> mapply(mean,X,trim=c(0,0.5,0.1)) [1] 2 5 8
lapply與map類似, do.call不是。 lapply將函數(shù)應(yīng)用于列表的所有元素, do.call調(diào)用一個(gè)函數(shù),其中所有的函數(shù)參數(shù)都在列表中。 所以對于一個(gè)n元素列表, lapply有n函數(shù)調(diào)用, do.call只有一個(gè)函數(shù)調(diào)用。 所以do.call與lapply完全不同。 希望這個(gè)澄清你的問題。
一個(gè)代碼示例:
do.call(sum, list(c(1,2,4,1,2), na.rm = TRUE))
和:
lapply(c(1,2,4,1,2), function(x) x + 1)
用最簡單的話來說:
lapply()為列表中的每個(gè)元素應(yīng)用一個(gè)給定的函數(shù),所以會(huì)有幾個(gè)函數(shù)調(diào)用。
do.call()將給定的函數(shù)作為一個(gè)整體應(yīng)用于列表,所以只有一個(gè)函數(shù)調(diào)用。
最好的學(xué)習(xí)方法是在R文檔中使用函數(shù)示例。
lapply()是一個(gè)類似地圖的函數(shù)。 do.call()是不同的。 它用于將parameter passing給列表forms的函數(shù),而不是枚舉它們。 例如,
> do.call("+",list(4,5)) [1] 9
雖然有很多答案,這里是我的例子供參考。 假設(shè)我們有一個(gè)數(shù)據(jù)列表:
L=list(c(1,2,3), c(4,5,6))
函數(shù)lapply返回一個(gè)列表。
lapply(L, sum)
上面的意思就像下面這樣。
list( sum( L[[1]]) , sum( L[[2]]))
現(xiàn)在讓我們?yōu)閐o.call做同樣的事情
do.call(sum, L)
它的意思是
sum( L[[1]], L[[2]])
在我們的例子中,它返回21.總之,lapply總是返回一個(gè)列表,而do.call的返回types實(shí)際上取決于執(zhí)行的函數(shù)。
兩者的區(qū)別是:
lapply(1:n,function,parameters)
=>這個(gè)發(fā)送1,參數(shù)到function=>這個(gè)發(fā)送2,參數(shù)到function等等
do.call
只需發(fā)送1 … n作為一個(gè)向量和參數(shù)來運(yùn)行
所以在應(yīng)用你有n個(gè)函數(shù)調(diào)用,在do.call中你只有一個(gè)
我覺得在這方面一個(gè)重要的方面沒有得到certificate(或?qū)ξ襾碚f不明顯)。 也就是說,您可以使用do.call將list中的命名parameter passing給函數(shù)。
例如, runif需要參數(shù)n , min和max 。 可以使用do.call來傳遞這些信息,如下所示。
para <- list(n = 10, min = -1, max = 1) do.call(runif, para) #[1] -0.4689827 -0.2557522 0.1457067 0.8164156 -0.5966361 0.7967794 #[7] 0.8893505 0.3215956 0.2582281 -0.8764275
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
R語言數(shù)據(jù)類型轉(zhuǎn)換的實(shí)現(xiàn)(向量,列表,矩陣)
我們在使用R語言做數(shù)據(jù)分析時(shí),會(huì)一直對數(shù)據(jù)進(jìn)行不同類型的轉(zhuǎn)換,本文主要介紹了R語言數(shù)據(jù)類型轉(zhuǎn)換的實(shí)現(xiàn),具有一定的參考價(jià)值,感興趣的可以了解一下2024-04-04R語言如何畫豎線、橫線、添加標(biāo)簽以及畫固定長度的線段
R語言繪圖的能力非常強(qiáng)大,有時(shí)看似繁復(fù)的圖形不過寥寥數(shù)行代碼就搞定,下面這篇文章主要給大家介紹了關(guān)于R語言如何畫豎線、橫線、添加標(biāo)簽以及畫固定長度的線段的相關(guān)資料,需要的朋友可以參考下2022-11-11使用R語言實(shí)現(xiàn)自動(dòng)文摘的方法
本文介紹了如何使用R語言實(shí)現(xiàn)自動(dòng)文摘,我們首先介紹了基于詞頻-逆文檔頻率(TF-IDF)的自動(dòng)文摘方法,包括創(chuàng)建詞項(xiàng)文檔矩陣,計(jì)算TF-IDF值,提取關(guān)鍵詞,以及根據(jù)關(guān)鍵詞生成摘要,需要的朋友一起學(xué)習(xí)下吧2023-05-05