Day15:使用dplyr轉換資料-Summary Functions(2)

2024 iThome 鐵人賽

DAY 15

AI/ ML & Data

資料科學的小筆記系列第 15 篇

16th鐵人賽

mimirjp

團隊iT 貓貓教

2024-08-26 20:54:26

652 瀏覽

分享至

今天繼續紀錄Summary Functions的應用

邏輯計算
mean(): TRUE值的比例
sum(): TRUE值的數量

順序取值
dplyr::first(): 第一個數值
dplyr::last(): 最後一個數值
dplyr::nth(): 在第n位置的數值

建立範例資料集

library(dplyr)

# 建立範例資料集
df <- data.frame(
  group = c("A", "A", "B", "B", "C", "C"),
  value = c(TRUE, FALSE, TRUE, TRUE, FALSE, TRUE),
  numbers = c(5, 3, 8, 6, 9, 2)
)

# 查看範例資料集
print(df)

計算每個分組（group）中 value 為 TRUE 的比例

df_summary <- df |>
  group_by(group) |>
  summarize(
    proportion_true = mean(value)  # 計算 TRUE 的比例
  )

print(df_summary)

計算每個分組（group）中 value 為 TRUE 的數量

df_summary <- df |>
  group_by(group) |>
  summarize(
    count_true = sum(value)  # 計算 TRUE 的數量
  )

print(df_summary)

回傳每個分組（group）中 numbers 變數的第一個值

df_summary <- df |>
  group_by(group) |>
  summarize(
    first_number = first(numbers)  # 返回第一個值
  )

print(df_summary)

回傳每個分組（group）中 numbers 變數的最後一個值

df_summary <- df |>
  group_by(group) |>
  summarize(
    last_number = last(numbers)  # 返回最後一個值
  )

print(df_summary)

回傳每個分組（group）中 numbers 變數的第2個值

df_summary <- df |>
  group_by(group) |>
  summarize(
    second_number = nth(numbers, 2)  # 返回第2個值
  )

print(df_summary)

參考資料：

Data transformation with dplyr :: Cheatsheet

Day14:使用dplyr轉換資料-Summary Functions(1)

Day16:使用dplyr轉換資料-Summary Functions(3)

系列文

資料科學的小筆記共 29 篇

RSS系列文訂閱系列文

4 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

資料科學的小筆記系列 第 15 篇

Day15:使用dplyr轉換資料-Summary Functions(2)

尚未有邦友留言

標記使用者

資料科學的小筆記系列第 15 篇