R語言ggplot2繪圖安裝與調(diào)試
0x01 安裝與R基礎(chǔ)
一直聽說數(shù)據(jù)分析里R語言是比較‘正統(tǒng)’,況且久聞ggplot2這些R語言的數(shù)據(jù)分析庫大名,想到今后數(shù)據(jù)分析和整理的需要,這里開一個簡單的系列學(xué)習(xí)一些R語言和ggplot2的繪圖基礎(chǔ)。本人學(xué)習(xí)的書籍是Winston Chang大佬的《R Graphics Cookbook》,且稍有一點Python里的Plotnine繪圖基礎(chǔ)。但我算是R語言小白,所以整個系列也可以記錄自己學(xué)習(xí)遇到的坑,供大家參考。
庫安裝
我使用的R版本為3.6.3,需要下載的庫包括ggplot2,gcookbook和dplyr庫。可以使用如下的安裝指令:
install.packages("ggplo2") install.packages("dplyr") install.packages("gcookbook")
如果遇到了installation of package ‘ggplot2’ had non-zero exit status類似的問題,可以指定安裝程序強制安裝二進制文件[1],如
install.packages("ggplo2", type = "binary")
R語言數(shù)據(jù)處理基礎(chǔ)
首先簡單介紹數(shù)據(jù)輸入常用的兩種方法,一種是CSV數(shù)據(jù),我們可以采用函數(shù)read.csv(file, args)
輸入;另一種常用數(shù)據(jù)EXCEL數(shù)據(jù)可以使用read_excel(file)
函數(shù)輸入數(shù)據(jù)。
dplyr包(magrittr包)提供了一種運算符%>%,可以在R中實現(xiàn)類似連續(xù)函數(shù)調(diào)用的編程方法,以嵌套函數(shù)f,g,h為例:
h(g(f(x))) # 等價于 x %>% f() %>% g() %>% h()
這樣的函數(shù)調(diào)用相比嵌套函數(shù)更加直觀,尤其是在多個連續(xù)的數(shù)據(jù)集處理場合。
基礎(chǔ)繪圖以及概念
散點圖和完整流程
繪制圖片使用的數(shù)據(jù)集為mtcars:
mtcars %>% head()
mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
在開始繪圖之前,有一點基本的R語言基礎(chǔ)設(shè)施需要準(zhǔn)備。R語言畫圖需要有基礎(chǔ)的畫布,可以用dev.new()函數(shù)來開啟一個新的畫布(如果是windows系統(tǒng)需要使用windows()函數(shù))。
dev.new() # windows() # windows系統(tǒng)使用
下面直接展示最簡單的散點圖繪制代碼:
p <- ggplot(mtcars, aes(x = wt, y = mpg)) + geom_point()
上面的代碼就是一個使用ggplot2繪圖的最基本結(jié)構(gòu),ggplot函數(shù)是保存數(shù)據(jù)集和映射信息(aes)等基本信息的繪圖主函數(shù),也可以理解為存儲所有信息的畫布底層。第一個參數(shù)放入數(shù)據(jù)集,后續(xù)的映射都在此數(shù)據(jù)集上進行,本例中就是使用了mtcars中的wt列作為x,mpg列作為y值。ggplot2中的函數(shù)基本均是加法進行組合,所以這里加上了geom_point函數(shù)組合進繪圖。此時geom_point函數(shù)通過ggplot函數(shù)可以得知其繪圖需要用到的鍵信息(x, y)分別對應(yīng)的數(shù)據(jù)值。代碼運行結(jié)果如下:
繪制完圖后,可以選擇print(p)來查看圖片并保存,或者使用ggplot2自帶的函數(shù)ggsave來保存圖片,基本的格式例如png,pdf等都有[2]。
ggsave(p, "p.png")
如果想要繪圖的數(shù)據(jù)不屬于同一個data frame,那么可以不指定ggplot函數(shù)的數(shù)據(jù)項,在aes映射中直接定義,如下所示:
ggplot(data=null, aes(x = mtcars$wt, y = mtcars$mpg))
其他基本繪圖與基礎(chǔ)
下面的代碼展示了R語言繪制線形圖的基本函數(shù)geom_line,同時展示了ggplot2通過組合函數(shù)geom_line和geom_point來繪圖的基本邏輯:
p <- ggplot(pressure, aes(x = temperature, y = pressure)) + geom_line() + geom_point()
對于柱形圖,ggplot2的相關(guān)支持比較多,這里展示最基礎(chǔ)的兩種,一個是geom_bar函數(shù):
p <- ggplot(mtcars, aes(x = factor(cyl))) + geom_bar()
這里有一個新的函數(shù)factor,這個函數(shù)是將數(shù)據(jù)列變化為因子,體現(xiàn)在圖上類似于將連續(xù)變量轉(zhuǎn)化為了離散的變量??梢钥吹?,上述的映射信息中不包括y值。這是因為geom_bar函數(shù)默認的運作方式count,也就是統(tǒng)計x的出現(xiàn)次數(shù)并繪圖,相當(dāng)于geom_bar(stat="count"),其中stat選項是統(tǒng)計函數(shù)的意思。如果需要繪制具體數(shù)值類似y值的柱形圖就需要用到下一個函數(shù)了。
第二個柱形圖的函數(shù)是geom_col函數(shù):
p <- ggplot(BOD, aes(x = factor(Time), y = demand)) + geom_col()
其實geom_col的效果與geom_bar(stat="identity")是一致的,這樣就能隨心所欲的繪制柱形圖了。
下面的代碼示例展示了繪制和柱形圖很像的直方圖的案例:
p <- ggplot(mtcars, aes(x = mpg)) + geom_histogram(binwidth = 3)
直方圖也是默認的頻率統(tǒng)計,這里略微調(diào)整了參數(shù)binwidth來放大每個直方的寬度。
下面的代碼展示了如何繪制箱型圖的例子:
p <- ggplot(ToothGrowth, aes(x = interaction(supp, dose), y = len)) + geom_boxplot()
上面除了基本代碼還用到了interaction函數(shù),用于組合變量,類似cross join的結(jié)果。
除開這些基本繪圖,數(shù)學(xué)函數(shù)的繪制也比較容易:
# 自定義函數(shù) myfun <- function(xvar) { 1 / (1 + exp(-xvar + 10)) } p <- ggplot(data.frame(xdata = c(0, 20)), aes(x = xdata)) + stat_function(fun = myfun, geom = "line")
上面的代碼首先定義了一個簡單的函數(shù),然后將函數(shù)作為自定義統(tǒng)計函數(shù)stat_function的fun參數(shù)輸入,并選擇繪圖方式為line,這樣就可以得到一條函數(shù)曲線。 總結(jié)
本節(jié)主旨在于R語言ggplot2繪圖的初探,熟悉基本的繪圖模式。后續(xù)將會一一展開學(xué)習(xí)庫中的繪圖細節(jié),完善繪圖質(zhì)量。
ggplot2是R語言中最常用的繪圖包之一,使用前需要進行安裝和調(diào)試。初學(xué)者可以通過學(xué)習(xí)ggplot2教程來更好地理解其繪圖語法和使用方法。掌握ggplot2可以幫助用戶輕松地創(chuàng)建高質(zhì)量的數(shù)據(jù)可視化圖表。
參考資料:
[1] 解決R包“had non-zero exit status”安裝報錯。
[2] ggplot2圖片保存
到此這篇關(guān)于R語言ggplot2繪圖安裝與調(diào)試的文章就介紹到這了,更多相關(guān)R語言ggplot2繪圖安裝內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
rust解決嵌套——Option類型的map和and_then方法的使用
這篇文章主要介紹了rust解決嵌套——Option類型的map和and_then方法,本文結(jié)合實例代碼給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-02-02關(guān)于Rust編譯時報link.exe?not?found錯誤問題
這篇文章主要介紹了Rust編譯的時候報出link.exe?not?found錯誤問題,解決方法是在命令行就是CMD執(zhí)行相應(yīng)的命令即可,本文給大家分解決方法,需要的朋友可以參考下2022-09-09Rust中類型轉(zhuǎn)換在錯誤處理中的應(yīng)用小結(jié)
隨著項目的進展,關(guān)于Rust的故事又翻開了新的一頁,今天來到了服務(wù)器端的開發(fā)場景,發(fā)現(xiàn)錯誤處理中的錯誤類型轉(zhuǎn)換有必要分享一下,對Rust錯誤處理相關(guān)知識感興趣的朋友一起看看吧2023-09-09rust標(biāo)準(zhǔn)庫std::env環(huán)境相關(guān)的常量
在本章節(jié)中, 我們探討了Rust處理命令行參數(shù)的常見的兩種方式和處理環(huán)境變量的兩種常見方式, 拋開Rust的語法, 實際上在命令行參數(shù)的處理方式上, 與其它語言大同小異, 可能影響我們習(xí)慣的也就只剩下語法,本文介紹rust標(biāo)準(zhǔn)庫std::env的相關(guān)知識,感興趣的朋友一起看看吧2024-03-03