gpt4 book ai didi

r - 只保留重复一次的行

转载 作者:行者123 更新时间:2023-12-04 11:28:08 24 4
gpt4 key购买 nike

这个问题在这里已经有了答案:





Subset data frame based on number of rows per group

(4 个回答)


2年前关闭。




我有一个如下所示的数据集:

A         B      C 
liver 5 RX
blood 9 DK
liver 7 DK
intestine 5 RX
blood 3 DX
blood 1 DX
skin 2 RX
skin 2 DX

我只想保留基于 A 的重复(不是三次重复等)条目.如果值在 A 中的含义是重复的,它应该打印整行。

理想的输出将如下所示:
A         B      C 
liver 5 RX
liver 7 DK
skin 2 RX
skin 2 DX

我尝试将以下代码与 dplyr 一起使用
df %>% group_by(A) %>% filter(n() >= 1)

有人可以在这里帮助我吗?

最佳答案

你可以做:

df %>%
group_by(A) %>%
filter(n() == 2)

A B C
<chr> <int> <chr>
1 liver 5 RX
2 liver 7 DK
3 skin 2 RX
4 skin 2 DX

或者更详细的方法来做同样的事情:
df %>%
add_count(A) %>%
filter(n == 2) %>%
select(-n)

或者:
df %>%
group_by(A) %>%
filter(max(row_number()) == 2)

考虑到您可能需要基于“A”列的重复案例,否则这些案例是唯一的:
df %>%
group_by(A) %>%
distinct() %>%
filter(n() == 2)

关于r - 只保留重复一次的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55695461/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com