gpt4 book ai didi

r - 仅识别非重复行

转载 作者:行者123 更新时间:2023-12-04 12:35:34 26 4
gpt4 key购买 nike

我有一个包含许多重复行的数据集,我只想隔离 非重复值 .
我的 df 看起来像这样

df <- data.frame("group" = c("A", "A", "A","A","A","B","B","B"), 
"id" = c("id1", "id2", "id3", "id1", "id2","id1","id2","id1"),
"Val" = c(10,10,10,10,10,12,12,12))

我想提取的只是没有重复的行。即我的最终数据集应该是这样的
final <- data.frame("group" = c("A","B"), 
"id" = c("id3","id2"),
"Val" = c(10,12))

注意我对查找唯一值不感兴趣,而是对非重复值感兴趣。
我知道如何找到唯一值,例如 df %>% distinct()做这项工作。这是我正在努力解决的个性化非重复行

最佳答案

这是一种选择。

library(dplyr)
df %>%
group_by(group) %>%
filter(!(duplicated(id)|duplicated(id, fromLast = TRUE)))

或与 dplyr独自的
df %>% 
group_by_all %>%
filter(n() ==1)

或使用 base R
df[!(duplicated(df[1:2])|duplicated(df[1:2], fromLast = TRUE)),]

关于r - 仅识别非重复行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58137783/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com