R語言-計(jì)算平均值不同函數(shù)的區(qū)別說明
函數(shù)mean
> mean(x) > num x1 x2 x3 10378050.50 89.45 81.18 80.45
此時(shí)對(duì)編號(hào)也求了平均值,不過往往我們只想對(duì)后面的數(shù)據(jù)求平均值。而且此時(shí)會(huì)出現(xiàn)一個(gè)警告。因?yàn)閤是一個(gè)數(shù)據(jù)框,不是數(shù)值,所以不能直接用mean()函數(shù)。
函數(shù)colMeans()
> colMeans(x) num x1 x2 x3 10378050.50 89.45 81.18 80.45 > colMeans(x)[c("x1","x2","x3")] x1 x2 x3 89.45 81.18 80.45
選擇x數(shù)據(jù)框中x1,x2,x3直接求平均值就行
函數(shù)apply–功能更強(qiáng)大,不只是可以用在求平均值上
> apply(x, 2, mean) num x1 x2 x3 10378050.50 89.45 81.18 80.45
使用apply,參數(shù)2的意思代表對(duì)列方向操作。
比如,求最大值和最小值
> apply(x[c("x1","x2","x3")], 2, max) x1 x2 x3 100 90 96
補(bǔ)充:R語言平均值,中位數(shù)和眾數(shù)
1.平均值
平均值是通過取數(shù)值的總和并除以數(shù)據(jù)序列中的值的數(shù)量來計(jì)算。函數(shù)mean()用于在R中計(jì)算平均值。
語法
R中計(jì)算平均值的基本語法是 -
mean(x, trim = 0, na.rm = FALSE, ...)
以下是使用的參數(shù)的描述 -
x - 是輸入向量。
trim - 用于從排序的向量的兩端刪除一些觀測值。
na.rm - 用于從輸入向量中刪除缺少的值。
示例
# Create a vector. x <- c(17,8,6,4.12,11,8,54,-11,18,-7) # Find Mean. result.mean <- mean(x) print(result.mean)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] 10.812
1.1.應(yīng)用修剪選項(xiàng)
當(dāng)提供trim參數(shù)時(shí),向量中的值進(jìn)行排序,然后從計(jì)算平均值中刪除所需數(shù)量的觀察值。
例如,當(dāng)trim = 0.3時(shí),每一端的3個(gè)值將從計(jì)算中刪除以找到均值。
在這種情況下,排序的向量為(-21,-5,2,3,42,7,8,12,18,54),從用于計(jì)算平均值的向量中從左邊刪除:(-21,-5,2)和從右邊刪除:(12,18,54)這幾個(gè)值。
# Create a vector. x <- c(12,7,3,4.2,18,2,54,-21,8,-5) # Find Mean. result.mean <- mean(x,trim = 0.3) print(result.mean)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] 5.55
1.2.應(yīng)用NA選項(xiàng)
如果缺少值,則平均函數(shù)返回NA。要從計(jì)算中刪除缺少的值,請(qǐng)使用na.rm = TRUE。 這意味著刪除NA值。參考以下示例代碼 -
# Create a vector. x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA) # Find mean. result.mean <- mean(x) print(result.mean) # Find mean dropping NA values. result.mean <- mean(x,na.rm = TRUE) print(result.mean)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] NA [1] 8.22
2.中位數(shù)
數(shù)據(jù)系列中的中間值被稱為中位數(shù)。R中使用median()函數(shù)來計(jì)算中位數(shù)。
語法
R中計(jì)算位數(shù)的基本語法是 -
median(x, na.rm = FALSE)
以下是使用的參數(shù)的描述 -
x - 是輸入向量。
na.rm - 用于從輸入向量中刪除缺少的值。
示例
# Create the vector. x <- c(12,7,3,4.2,18,2,54,-21,8,-5) # Find the median. median.result <- median(x) print(median.result)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] 5.6
3.眾數(shù)
眾數(shù)是指給定的一組數(shù)據(jù)集合中出現(xiàn)次數(shù)最多的值。不同于平均值和中位數(shù),眾數(shù)可以同時(shí)具有數(shù)字和字符數(shù)據(jù)。
R沒有標(biāo)準(zhǔn)的內(nèi)置函數(shù)來計(jì)算眾數(shù)。因此,我們將創(chuàng)建一個(gè)用戶自定義函數(shù)來計(jì)算R中的數(shù)據(jù)集的眾數(shù)。該函數(shù)將向量作為輸入,并將眾數(shù)值作為輸出。
示例
# Create the function. getmode <- function(v) { uniqv <- unique(v) uniqv[which.max(tabulate(match(v, uniqv)))] } # Create the vector with numbers. v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3) # Calculate the mode using the user function. result <- getmode(v) print(result) # Create the vector with characters. charv <- c("baidu.com","tmall.com","yiibai.com","qq.com","yiibai.com") # Calculate the mode using the user function. result <- getmode(charv) print(result)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] 2 [1] "yiibai.com"
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
R語言繪圖數(shù)據(jù)可視化Ridgeline plot山脊圖畫法
這篇文章主要為大家介紹了R語言繪圖數(shù)據(jù)可視化Ridgeline plot山脊圖畫法的示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助2022-02-02R語言矩陣知識(shí)點(diǎn)總結(jié)及實(shí)例分析
在本篇文章里小編給各位整理了一篇關(guān)于R語言矩陣知識(shí)點(diǎn)總結(jié)及實(shí)例分析,對(duì)此有興趣的朋友們可以學(xué)習(xí)下。2021-04-04R語言實(shí)現(xiàn)ggplot重繪天貓雙十一銷售額曲線圖過程
這篇文章主要為大家介紹了如何使用ggplot繪制天貓雙十一銷售額曲線圖的實(shí)現(xiàn)過程,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2021-11-11