快捷導(dǎo)航

R語言-計(jì)算平均值不同函數(shù)的區(qū)別說明

更新時(shí)間：2021年04月19日 11:04:33 作者：miss芥末醬

這篇文章主要介紹了R語言-計(jì)算平均值不同函數(shù)的區(qū)別說明，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧

函數(shù)mean

> mean(x)
>         num          x1          x2          x3 
10378050.50       89.45       81.18       80.45

此時(shí)對(duì)編號(hào)也求了平均值，不過往往我們只想對(duì)后面的數(shù)據(jù)求平均值。而且此時(shí)會(huì)出現(xiàn)一個(gè)警告。因?yàn)閤是一個(gè)數(shù)據(jù)框，不是數(shù)值，所以不能直接用mean（）函數(shù)。

函數(shù)colMeans（）

> colMeans(x)
        num          x1          x2          x3 
10378050.50       89.45       81.18       80.45 
> colMeans(x)[c("x1","x2","x3")]
   x1    x2    x3 
89.45 81.18 80.45

選擇x數(shù)據(jù)框中x1，x2，x3直接求平均值就行

函數(shù)apply–功能更強(qiáng)大，不只是可以用在求平均值上

> apply(x, 2, mean)
        num          x1          x2          x3 
10378050.50       89.45       81.18       80.45

使用apply，參數(shù)2的意思代表對(duì)列方向操作。

比如，求最大值和最小值

> apply(x[c("x1","x2","x3")], 2, max)
 x1  x2  x3 
100  90  96

補(bǔ)充：R語言平均值，中位數(shù)和眾數(shù)

1.平均值

平均值是通過取數(shù)值的總和并除以數(shù)據(jù)序列中的值的數(shù)量來計(jì)算。函數(shù)mean()用于在R中計(jì)算平均值。

語法

R中計(jì)算平均值的基本語法是 -

mean(x, trim = 0, na.rm = FALSE, ...)

以下是使用的參數(shù)的描述 -

x - 是輸入向量。

trim - 用于從排序的向量的兩端刪除一些觀測值。

na.rm - 用于從輸入向量中刪除缺少的值。

示例

# Create a vector. 
x <- c(17,8,6,4.12,11,8,54,-11,18,-7)
 
# Find Mean.
result.mean <- mean(x)
print(result.mean)

當(dāng)我們執(zhí)行上述代碼時(shí)，會(huì)產(chǎn)生以下結(jié)果 -

[1] 10.812

1.1.應(yīng)用修剪選項(xiàng)

當(dāng)提供trim參數(shù)時(shí)，向量中的值進(jìn)行排序，然后從計(jì)算平均值中刪除所需數(shù)量的觀察值。

例如，當(dāng)trim = 0.3時(shí)，每一端的3個(gè)值將從計(jì)算中刪除以找到均值。

在這種情況下，排序的向量為(-21，-5,2,3,42,7,8,12,18,54)，從用于計(jì)算平均值的向量中從左邊刪除：(-21，-5,2)和從右邊刪除：(12,18,54)這幾個(gè)值。

# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
 
# Find Mean.
result.mean <-  mean(x,trim = 0.3)
print(result.mean)

當(dāng)我們執(zhí)行上述代碼時(shí)，會(huì)產(chǎn)生以下結(jié)果 -

[1] 5.55

1.2.應(yīng)用NA選項(xiàng)

如果缺少值，則平均函數(shù)返回NA。要從計(jì)算中刪除缺少的值，請(qǐng)使用na.rm = TRUE。這意味著刪除NA值。參考以下示例代碼 -

# Create a vector. 
x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA)
 
# Find mean.
result.mean <-  mean(x)
print(result.mean)
 
# Find mean dropping NA values.
result.mean <-  mean(x,na.rm = TRUE)
print(result.mean)

當(dāng)我們執(zhí)行上述代碼時(shí)，會(huì)產(chǎn)生以下結(jié)果 -

[1] NA
[1] 8.22

2.中位數(shù)

數(shù)據(jù)系列中的中間值被稱為中位數(shù)。R中使用median()函數(shù)來計(jì)算中位數(shù)。

語法

R中計(jì)算位數(shù)的基本語法是 -

median(x, na.rm = FALSE)

以下是使用的參數(shù)的描述 -

x - 是輸入向量。

na.rm - 用于從輸入向量中刪除缺少的值。

示例

# Create the vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
 
# Find the median.
median.result <- median(x)
print(median.result)

當(dāng)我們執(zhí)行上述代碼時(shí)，會(huì)產(chǎn)生以下結(jié)果 -

[1] 5.6

3.眾數(shù)

眾數(shù)是指給定的一組數(shù)據(jù)集合中出現(xiàn)次數(shù)最多的值。不同于平均值和中位數(shù)，眾數(shù)可以同時(shí)具有數(shù)字和字符數(shù)據(jù)。

R沒有標(biāo)準(zhǔn)的內(nèi)置函數(shù)來計(jì)算眾數(shù)。因此，我們將創(chuàng)建一個(gè)用戶自定義函數(shù)來計(jì)算R中的數(shù)據(jù)集的眾數(shù)。該函數(shù)將向量作為輸入，并將眾數(shù)值作為輸出。

示例

# Create the function.
getmode <- function(v) {
   uniqv <- unique(v)
   uniqv[which.max(tabulate(match(v, uniqv)))]
}
 
# Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)
 
# Calculate the mode using the user function.
result <- getmode(v)
print(result)
 
# Create the vector with characters.
charv <- c("baidu.com","tmall.com","yiibai.com","qq.com","yiibai.com")
 
# Calculate the mode using the user function.
result <- getmode(charv)
print(result)

當(dāng)我們執(zhí)行上述代碼時(shí)，會(huì)產(chǎn)生以下結(jié)果 -