iT邦幫忙

2024 iThome 鐵人賽

DAY 16
0
AI/ ML & Data

資料科學的小筆記系列 第 16

Day16:使用dplyr轉換資料-Summary Functions(3)

  • 分享至 

  • xImage
  •  

今天繼續紀錄Summary Functions的應用~

  1. quantile(): 計算第 n 個分位數
  2. min(): 計算最小值
  3. max(): 計算最大值
  4. IQR(): 計算四分位距
  5. mad(): 計算中位數絕對偏差
  6. sd(): 計算標準差
  7. var(): 計算變異數

建立範例資料集

library(dplyr)

# 建立範例資料集
df <- data.frame(
  group = c("A", "A", "B", "B", "C", "C"),
  numbers = c(5, 3, 8, 6, 9, 2)
)

# 查看範例資料集
print(df)

https://ithelp.ithome.com.tw/upload/images/20240827/20168607KRcM7XKLTm.png

計算每個分組(group)中 numbers 變數的第 50 個百分位數(即中位數)

df_summary <- df |>
 group_by(group) |>
 summarize(
   median_quantile = quantile(numbers, 0.5)  # 計算中位數 (50% 分位數)
 )

print(df_summary)

https://ithelp.ithome.com.tw/upload/images/20240827/20168607bheKNtjGcf.png

計算每個分組(group)中 numbers 變數的最小值

https://ithelp.ithome.com.tw/upload/images/20240827/20168607HElUGW8Mhv.png

參考資料:

  1. Data transformation with dplyr :: Cheatsheet

上一篇
Day15:使用dplyr轉換資料-Summary Functions(2)
下一篇
Day17:使用tibble套件的Row Names相關函式
系列文
資料科學的小筆記29
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言