iT邦幫忙

鐵人檔案

2024 iThome 鐵人賽
回列表
AI/ ML & Data

資料科學的小筆記 系列

一直都有想要養成寫文章的習慣,但一直在重度拖延症下遲遲沒有行動,藉著友人邀約鐵人賽的機會,嘗試30天寫點小東西,本來想寫一些Python的內容,不過自己剛好在新工作的轉換期,要重拾學生時代使用的R語言,所以就當做複習的筆記,然後有可能參雜一些工作上發現的內容,請大家就隨意看看囉XDDD

鐵人鍊成 | 共 30 篇文章 | 4 人訂閱 訂閱系列文 RSS系列文 團隊iT 貓貓教
DAY 11

Day11:使用dplyr轉換資料-Vectorized Functions(3)

雜談因為在新手訓練時間不能回覆他人的留言,導致我不能回覆Day9的邦友回覆(甚至試了兩次QQ)。在此說明一下:標題會提到Vectorized Functions...

2024-08-22 ‧ 由 mimirjp 分享
DAY 12

Day12:使用dplyr轉換資料-Vectorized Functions(4)

正文 今天要紀錄的是mutate()可以搭配的數學運算: +, -, /, ^, %/%, %%: 算數運算 log(), log2(), log10():...

2024-08-23 ‧ 由 mimirjp 分享
DAY 13

Day13:使用dplyr轉換資料-Vectorized Functions(5)

正文 今天要紀錄的函式: dplyr::case_when(): 多條件的 if_else(),根據多個條件來創建新的變數。依序檢查每個條件,並根據第一個符合...

2024-08-24 ‧ 由 mimirjp 分享
DAY 14

Day14:使用dplyr轉換資料-Summary Functions(1)

雜談感謝obarisk邦友在Day11的回覆,也感謝提供實作自訂向量化函式,我後來也有在Stack Overflow看到類似的討論How to define a...

2024-08-25 ‧ 由 mimirjp 分享
DAY 15

Day15:使用dplyr轉換資料-Summary Functions(2)

今天繼續紀錄Summary Functions的應用 邏輯計算mean(): TRUE值的比例sum(): TRUE值的數量 順序取值dplyr::first(...

2024-08-26 ‧ 由 mimirjp 分享
DAY 16

Day16:使用dplyr轉換資料-Summary Functions(3)

今天繼續紀錄Summary Functions的應用~ quantile(): 計算第 n 個分位數 min(): 計算最小值 max(): 計算最大值 IQ...

2024-08-27 ‧ 由 mimirjp 分享
DAY 17

Day17:使用tibble套件的Row Names相關函式

今天要來紀錄列名相關的函式 在整理資料時,Tidy data 的原則建議將資料的所有變數儲存在列或欄中,而不是使用 rownames,因為 rownames 是...

2024-08-28 ‧ 由 mimirjp 分享
DAY 18

Day18:使用dplyr合併資料表

建立範例資料表 library(dplyr) # 建立表格 x x <- tribble( ~A, ~B, ~C, "a"...

2024-08-29 ‧ 由 mimirjp 分享
DAY 19

Day19:使用dplyr進行資料表連結

今天要來紀錄常用的“Mutating Joins” 函式,用來將兩個資料表根據匹配的列進行合併 建立範例資料表 library(dplyr) # 建立表格 x...

2024-08-30 ‧ 由 mimirjp 分享
DAY 20

Day20:使用dplyr進行篩選資料列

今天要來紀錄Filtering Joins函式,這些函式可以用來過濾表格中的列,是根據另一個資料表來決定哪些列應該保留或排除。 建立範例資料表 library(...

2024-08-31 ‧ 由 mimirjp 分享