iT邦幫忙

2024 iThome 鐵人賽

DAY 27
0
AI/ ML & Data

資料科學的小筆記系列 第 27

Day27:使用dplyr的集合運算函數

  • 分享至 

  • xImage
  •  

接續昨天紀錄的內容~dplyr的集合運算函數~

建立範例資料集

library(dplyr)

# 建立表格 x 和 y
x <- tribble(
  ~A,  ~B, ~C,
  "a", "t",  1,
  "b", "u",  2,
  "c", "v",  3
)

y <- tribble(
  ~A,  ~B, ~C,
  "b", "u",  2,
  "c", "v",  4,
  "d", "w",  5
)
  1. union(): 合併兩個資料表,並移除重複的列
    說明: union() 函式會回傳 x 和 y 資料表中的所有列,並移除重複列。union_all() 則會保留重複列。
# 合併兩個資料表,移除重複的列
result_union <- union(x, y)

print(result_union)

https://ithelp.ithome.com.tw/upload/images/20240907/201686073myZYZbPbf.png

若不要移除重複列

result_union_all <- union_all(x, y)

print(result_union_all)

https://ithelp.ithome.com.tw/upload/images/20240907/20168607vsUOxqHFJQ.png

  1. setequal(): 測試兩個資料表是否完全相同
    說明: setequal() 函式會測試兩個資料表是否包含完全相同的列,不會考慮列的順序。
# 測試兩個資料表是否完全相同
result_setequal <- setequal(x, y)

print(result_setequal)

https://ithelp.ithome.com.tw/upload/images/20240907/20168607ehWebucU78.png

今天的小筆記先到這邊~

參考資料:

  1. Data transformation with dplyr :: Cheatsheet

上一篇
Day26:使用dplyr的集合運算函數
下一篇
Day28:使用purrr套件進行functional programming(1)
系列文
資料科學的小筆記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言