gpt4 book ai didi

r - 结合group_by和distinct

转载 作者:行者123 更新时间:2023-12-02 10:38:17 24 4
gpt4 key购买 nike

我有一个 data.frame ,其中包含两个变量 id.xid.y,它们的组合唯一标识每一行,但重复多次数据集中的时间。

我想使用dplyrgroup_byid.x,以便每个id.x匹配具有独特的id.y

编辑编辑示例以突出显示unique id.x.id.y的不同数量

一个例子:

  id.x id.y
a o
a p
a q
c o
c p
c q

将返回:

 id.x id.y
a o
c q

dput 例如:

structure(list(id.x = structure(c(1L, 1L, 1L, 2L, 2L, 2L), .Label = c("a", 
"c"), class = "factor"), id.y = structure(c(1L, 2L, 3L, 1L, 2L,
3L), .Label = c("o", "p", "q"), class = "factor")), .Names = c("id.x",
"id.y"), row.names = c(NA, -6L), class = "data.frame")

编辑如果我想要的结果可以在不使用group_bydistinct的情况下实现,那也很好!我还使用 data.table,并且 data.table 解决方案就可以了。

最佳答案

使用dplyr

df %>% filter(dense_rank(id.x)==dense_rank(id.y))

返回

  id.x id.y
1 a o
2 c p

关于r - 结合group_by和distinct,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30787035/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com