很高興有這個機會去進行鐵人賽,在寫 30 天文章的過程中,讓我有機會好好督促自己整理以前的筆記。過程中發現了很多沒有理解透徹的觀念,趁著這個機會把不確定的部分好好補強了。
很感謝機器學習課程上王老師提供的清楚脈絡,也很感謝網路上各種厲害的人提供的範例,讓我在撰寫文章和實作建立模型時能作為參考。當然還有,很感謝 lab 的大家都認真準時繳交以及老師給予的鼓勵,讓我有動力每天準時上傳、堅持下去。
最後~ 謝謝來閱讀這三十天機器學習與資料視覺化 R、Python 筆記的大家~
今天是第三十天終於結束了,30天意外好漫長呀!!!
在最後幫前面幾天做個歸納統整吧:
然後做完分析後往往需要視覺化的呈現,清晰的圖表總是能讓人賞心悅目,所以最後在下面附上幾個自己覺得不錯、統計繪圖上常常常有幫助的網站,祝大家都能有滿意的分析結果並畫出美麗的圖表展示。
除了EDA那天介紹過的幾個內建的基礎資料視覺化圖形, R 裡也有一個繪圖套件latice
,讓人能夠以plot_function(y~x|given_group)
的形式繪製比較基本常在統計分析時使用到的圖形。
附上Lattice圖形函式參考連結,以及套件詳細說明。
ggplot2 是一個在R裡常用的進階繪圖套件,可以協助劃出很複雜的圖形。
gg 代表的是grammar graphic,表示本套件是藉由 grammar of graphic 的概念繪圖,使用圖層疊加的方式繪製出精細的複雜圖形。
使用和安裝的套件為ggplot2,可使用以下方式安裝:
# The easiest way to get ggplot2 is to install the whole tidyverse:
install.packages("tidyverse")
# Alternatively, install just ggplot2:
install.packages("ggplot2")
# Or the development version from GitHub:
# install.packages("devtools")
devtools::install_github("tidyverse/ggplot2")
圖層疊加:
ggplot (data = <DATA> ) +
<GEOM_FUNCTION> (mapping = aes( <MAPPINGS> ),
stat = <STAT> , position = <POSITION> ) +
<COORDINATE_FUNCTION> +
<FACET_FUNCTION> +
<SCALE_FUNCTION> +
<THEME_FUNCTION>
套件的介紹網站提供了不錯的Cheatsheet,讓人在繪圖時節省很多時間達到目標。
如果想詳細了解各種圖形的繪圖步驟、方式,可以參考The R Graphics Cookbook by Winston Chang. (2022.)這本書的線上連結。
除此之外也有額外的動畫套件gganimate
,協助製作gif動圖。套件詳細說明連結。
[補充]
tidyverse是資料分析時常用的整合性套件,內包含
視覺化工具、模型、資料轉換、資料讀取的套件們 。相關介紹可以參考R for Data Science
bY Hadley Wickham & Garrett Grolemund. (2017.) 這本書的線上連結。
做完分析後,如果想把模型製作成互動式的 dashboard ,呈現一個使用者能自由操作的模式,則推薦使用shiny
套件。
Shiny Gallery的網站提供很多範例供人參考。
The R Graph Gallery 也是一個不錯的網站。如果想呈現的圖一時之間畫不出來,網站上有詳細的分類,讓人能一目了然找到不錯的範例。
R Lattice Package | A must-learn concept for all R programmers
https://data-flair.training/blogs/r-lattice-package/
ggplot2
https://ggplot2.tidyverse.org/
The R Graphics Cookbook
https://r-graphics.org/
R Graphics Cookbook
https://r-graphics.org/
gganimate
https://gganimate.com/index.html
R for Data Science
https://r4ds.had.co.nz/index.html
Shiny Gallery
https://shiny.rstudio.com/tutorial/
The R Graph Gallery
https://r-graph-gallery.com/index.html
圖片來源:
analyse-R – Introduction à l’analyse d’enquêtes avec R et RStudio
(ggplot2 et la grammaire des graphiques)(by Dernière mise à jour, 2019.)
https://afalco.github.io/analyse-R/graphiques-bivaries-ggplot2.html
累累貓咪gif製作來源網站:
https://memes.tw/gif-post?maker=311