iT邦幫忙

2024 iThome 鐵人賽

DAY 3
1
AI/ ML & Data

資料科學的小筆記系列 第 3

Day3: 使用dplyr轉換資料-Group Cases

  • 分享至 

  • xImage
  •  

正文
今天要來紀錄的是dplyr的分群計算,函式包括

  1. group_by(.data, ..., .add = FALSE, .drop = TRUE):此函式會生成一個依據...分組好的資料集--,之後可以在調用其他函式來進行分群計算並將結果組合起來。
  2. rowwise(.data, ...):此函式為將個別列當作分群依據,所以會依照每個列去計算結果。
  3. ungroup(x,...):回傳解除分組後的資料集。

在mtcars資料集中,依照cyl分群進行mpg的平均計算

mtcars |>
  group_by(cyl) |>
  summarize(avg = mean(mpg))

https://ithelp.ithome.com.tw/upload/images/20240814/201686075GvxFxCZEO.png

在starwars資料集中,對files欄位的的每一列計算長度,在此的files欄位資料格式為list

class(starwars$films)

View(starwars |>
       rowwise() |>
         mutate(film_count = length(films)))

https://ithelp.ithome.com.tw/upload/images/20240814/20168607itdLuLrTX0.png

回傳解除分組的資料集

g_mtcars <- mtcars |> group_by(cyl)
ungroup(g_mtcars)

今天的小筆記就先到這邊,大家明天見~~

參考資料:Data transformation with dplyr :: Cheatsheet


上一篇
Day2: 使用dplyr轉換資料-Summarize Cases
下一篇
Day4:使用dplyr轉換資料-Manipulate Cases (1)
系列文
資料科學的小筆記5
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言