R語言boxplot函數(shù)深入講解
箱線圖簡介
箱線圖又稱箱形圖或盒須圖,該圖是由5個特征值繪制而成的圖形。
5個特征值是變量的最大值、最小值、中位數(shù)、第1四分位數(shù)和第3四分位數(shù)。
連接兩個分位數(shù)畫出一個箱子,箱子用中位數(shù)分割,把兩個極值點與箱子用線條連接,即成箱線圖。
R中繪制箱線圖的函數(shù)boxplot
(1)基本用法
boxplot(x, ...)
(2)公式形式的用法
boxplot(formula, data = NULL, ..., subset, na.action = NULL, drop = FALSE, sep = ".", lex.order = FALSE)
(3)默認用法
boxplot(x, ..., range = 1.5, width = NULL, varwidth = FALSE, notch = FALSE, outline = TRUE, names, plot = TRUE, border = par("fg"), col = NULL, log = "", pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5), horizontal = FALSE, add = FALSE, at = NULL)
主要參數(shù)的含義:
x
: 向量,列表或數(shù)據(jù)框。
formula
: 公式,形如y~grp,其中y為向量,grp是數(shù)據(jù)的分組,通常為因子。
data
: 數(shù)據(jù)框或列表,用于提供公式中的數(shù)據(jù)。
range
: 數(shù)值,默認為1.5,表示觸須的范圍,即range × (Q3 - Q1)
width
: 箱體的相對寬度,當(dāng)有多個箱體時,有效。
varwidth
: 邏輯值,控制箱體的寬度, 只有圖中有多個箱體時才發(fā)揮作用,默認為FALSE, 所有箱體的寬度相同,當(dāng)其值為TRUE時,代表每個箱體的樣本量作為其相對寬度
notch
: 邏輯值,如果該參數(shù)設(shè)置為TRUE,則在箱體兩側(cè)會出現(xiàn)凹口。默認為FALSE。
outline
: 邏輯值,如果該參數(shù)設(shè)置為FALSE,則箱線圖中不會繪制離群值。默認為TRUE。
names
:繪制在每個箱線圖下方的分組標簽。
plot
: 邏輯值,是否繪制箱線圖,如設(shè)置為FALSE,則不繪制箱線圖,而給出繪制箱線圖的相關(guān)信息,如5個點的信息等。
border
:箱線圖的邊框顏色。
col
:箱線圖的填充色。
horizontal
:邏輯值,指定箱線圖是否水平繪制,默認為FALSE。
boxplot函數(shù)用法舉例
(1)簡單使用情況
統(tǒng)計某中學(xué)學(xué)生的身高數(shù)據(jù)如下:
144, 166, 163, 143, 152, 169, 130, 159, 160, 175, 161, 170, 146, 159, 150, 183, 165, 146, 169
繪制其箱線圖。
h <- c(144,166,163,143,152,169,130,159,160,175,161,170, 146,159,150,183,165,146,169)
boxplot(h)
結(jié)果如下圖所示:
簡單的箱線圖
(2)多組的箱線圖
某工廠推行新的工作方法,實驗組和對照組(原方法)的工作效率(每小時產(chǎn)量),如下面的數(shù)據(jù):
試驗組:35, 41, 40, 37, 43, 32, 39, 46
對照組:32, 39, 34, 36, 32, 38, 34, 31
繪制其箱線圖。
編寫R程序如下:
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31) f <- factor(rep(c("試驗組","對照組"), each=8)) #定義分組因子 data<- data.frame(x,f) #生成數(shù)據(jù)框 boxplot(x~f,data)
結(jié)果如下圖所示:
多組對比箱線圖
(3)width參數(shù),border參數(shù)和col參數(shù)的使用
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31) f <- factor(rep(c("試驗組","對照組"), each=8)) data<- data.frame(x,f) boxplot(x~f,data,width=c(1,2), col=c(2,3), border=c("darkgray","purple"))
效果如下圖所示:
為箱線圖添加顏色等
從圖中可以看出,第二個箱線圖的寬度是第一個的2倍。各線框的顏色和背景顏色也不同。這主要由width參數(shù)、col參數(shù)和border參數(shù)給定的。
(4)帶凹口的箱線圖
x <- c(35, 41, 40, 37, 43, 32, 39, 46, 32, 39, 34, 36, 32, 38, 34, 31) f <- factor(rep(c("試驗組","對照組"), each=8)) data<- data.frame(x, f) boxplot(x~f,data,width=c(1,2), col=c(2,3), notch=TRUE)
如下圖所示:
帶凹口的箱線圖
到此這篇關(guān)于R語言boxplot函數(shù)深入講解的文章就介紹到這了,更多相關(guān)R語言boxplot函數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
基于R語言時間序列的平穩(wěn)時間序列模型預(yù)測圖文詳解
時間序列是將統(tǒng)一統(tǒng)計值按照時間發(fā)生的先后順序來進行排列,時間序列分析的主要目的是根據(jù)已有數(shù)據(jù)對未來進行預(yù)測,下面這篇文章主要給大家介紹了基于R語言時間序列的平穩(wěn)時間序列模型預(yù)測的相關(guān)資料,需要的朋友可以參考下2022-12-12R語言數(shù)據(jù)可視化包ggplot2畫圖之散點圖的基本畫法
散點圖主要用于描述兩個連續(xù)變量之間的關(guān)系,通過散點圖發(fā)現(xiàn)變量之間的相關(guān)性強度、是否存在線性關(guān)系等,下面這篇文章主要給大家介紹了關(guān)于R語言數(shù)據(jù)可視化包ggplot2畫圖之散點圖的基本畫法,需要的朋友可以參考下2022-11-11R語言常用函數(shù)總結(jié)梳理(基本對象字符處理?數(shù)學(xué)?統(tǒng)計)
這篇文章主要介紹了R語言常用函數(shù)總結(jié)梳理(基本對象字符處理?數(shù)學(xué)?統(tǒng)計),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-10-10