今天要來紀錄Filtering Joins函式,這些函式可以用來過濾表格中的列,是根據另一個資料表來決定哪些列應該保留或排除。
建立範例資料表
library(dplyr)
# 建立表格 x
x <- tribble(
~A, ~B, ~C,
"a", "t", 1,
"b", "u", 2,
"c", "v", 3
)
# 建立表格 y
y <- tribble(
~A, ~B, ~D,
"a", "t", 3,
"b", "u", 2,
"d", "w", 1
)
# semi_join 保留有匹配的資料列
semi_join_result <- semi_join(x, y, by = c("A", "B"))
# 查看結果
print(semi_join_result)
# anti_join 排除有匹配的資料列
anti_join_result <- anti_join(x, y, by = c("A", "B"))
# 查看結果
print(anti_join_result)
參考資料: