gpt4 book ai didi

r - R data.table 的合并指示器?

转载 作者:行者123 更新时间:2023-12-04 09:29:58 25 4
gpt4 key购买 nike

我的问题与this question有关但它在问 dplyr解决方案。
我想做的是执行外连接并创建一个指示符变量来解释合并结果,例如 pandasSTATA会做。
具体来说,我想要_merge全外连接操作后的列,指示与 left_only 或 right_only 或两者的合并结果,如下例所示。
更新:我已经更新了示例

key1 = c('a','b','c','d','e')
v1 = c(1,2,3, NA, 5)
key2 = c('a','b','d','f')
v2 = c(4,5,6,7)
df1 = data.frame(key=key1,v1)
df2 = data.frame(key=key2,v2)

> df1
key v1
1: a 1
2: b 2
3: c 3
4: d NA
5: e 5

> df2
key v2
1: a 4
2: b 5
3: d 6
4: f 7

# merge result I'd like to have

key v1 v2 _merge
1: a 1 4 both
2: b 2 5 both
3: c 3 NA left_only
4: d NA 6 both # <- not right_only, both
5: e 5 NA left_only
6: f NA 7 right_only
我想知道我是否缺少现有的 data.table功能,还是有一种简单的方法来完成这项任务?

最佳答案

您可以使用 merge.data.tableall=TRUE对于完整的外部联接:

library(data.table)
setDT(df1)
setDT(df2)
DT <- merge(df1[, r1 := .I], df2[, r2 := .I], by="key", all=TRUE)
DT[, merge_ := "both"][
is.na(r1), merge_ := "right_only"][
is.na(r2), merge_ := "left_only"]
输出:
   key v1 r1 v2 r2     merge_
1: a 1 1 4 1 both
2: b 2 2 5 2 both
3: c 3 3 NA NA left_only
4: d NA NA 6 3 right_only
数据:
key1 = c('a','b','c')
v1 = c(1,2,3)
key2 = c('a','b','d')
v2 = c(4,5,6)
df1 = data.frame(key=key1,v1)
df2 = data.frame(key=key2,v2)

正如 Michael Chirico 所提到的,与 data.table_1.13.0 2020 年 7 月 24 日发布,也可以使用 fcase如下:
DT[, merge_ := fcase(
is.na(r1), "right_only",
is.na(r2), "left_only",
default = "both"
)]

关于r - R data.table 的合并指示器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62886025/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com