iT邦幫忙

2023 iThome 鐵人賽

DAY 8
0
AI & Data

30天輕鬆搞定資料分析系列 第 17

DAY-17 淺談R語言(1)

  • 分享至 

  • xImage
  •  

R語言是一個針對統計計算及繪圖而開發的環境,提供了多種統計模型分析,有著高度客製化彈性。

分享一下R語言的歷史,R是由紐西蘭奧克蘭大學的統計學家開發的,現在是R核心小組負責開發,同時也有其他使用者編寫了諸多外掛的軟體套件。以S語言為基礎,增加了Scheme語言中詞法作用域機制,使程式設計師得以將代碼中某一對象的適用範圍限制到一小段代碼之中。

  • R語言提供很多數據可視化工具和套件,能夠創建多種類型的圖表和圖形,以更好地理解和呈現數據。
  1. ggplot2: ggplot2是R中最流行的數據可視化套件之一。它基於“圖形語法”思想,使得創建高質量的靜態圖表變得簡單而優雅。支持各種圖表類型,包括散點圖、直方圖、線圖、盒形圖等。
  2. lattice:lattice是用於創建多面板圖表(例如散點圖矩陣、條形圖矩陣)的強大套件。它專注於多變數可視化,特別適用於探索數據中的多個變數之間的關係。
  3. plotly:plotly是一個互動式可視化套件,允許用戶創建互動式圖表,這些圖表可以在網頁上進行縮放、標記和交互操作。它支持散點圖、3D圖表、地圖等。
  4. Ggvis:ggvis是ggplot2的擴展,專注於互動式可視化。它允許用戶創建互動式圖表,並可以方便地嵌入到R Markdown文檔中。
  5. leaflet:leaflet是用於創建交互式地圖和地理信息可視化的套件。它可顯示地理空間數據,包括點、線、多邊形等。
  • 時間序列分析是一種用於處理按時間順序排列的數據的統計方法。R語言提供了多個強大的套件和函數,用於進行時間序列數據的探索性分析、模型擬合和預測。xts(eXtensible Time Series)套件是處理和分析時間序列數據的基礎工具,zoo、TTR、forecast套件也都是時間序列分析相關套件。
  • R語言在機器學習人工智慧領域也具有強大的功能,提供了多個用於機器學習建模和分析的套件和函數。相關套件有caret套件(Classification And Regression Training)用於執行分類和回歸模型的訓練和評估、randomForest用於隨機森林模型的套件、xgboost實現了梯度提升樹算法。

今天大概認識了R語言,明天就一起來安裝看看吧!


上一篇
DAY-16 常見的業務分析模型:認識模型,套用到生活
下一篇
DAY-18 淺談R語言(2)
系列文
30天輕鬆搞定資料分析30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言