% -6ren">
gpt4 book ai didi

r - 使用 dplyr 中的函数合并其他行中的值

转载 作者:行者123 更新时间:2023-12-01 07:55:55 25 4
gpt4 key购买 nike

提前为笨重的代码道歉。
我有一个类似于以下的数据框:

df <- data.frame(c(rep_len(1,5), 2, 2), c("A", "A", "B", "B", "C", "C", "C"))
names(df) <- c("id", "consequence")

id consequence
1 1 A
2 1 A
3 1 B
4 1 B
5 1 C
6 2 C
7 2 C

我想执行以下过滤操作:

if a group by id contains consequences A or B, then keep these rows, and remove rows with consequence C. If a group contains only C, or a single row, then keep those/that rows/row.



我曾尝试在 dplyr 中使用自定义函数执行此操作,但存在所有行都被过滤的问题,从而消除了所有后果 C:
# filtering function:
consequence_select <- function(x) {
if(n_distinct(x$consequence) > 1) {
if(any(unique(x$consequence) %in% c("A", "B"))) {
x %>%
filter(consequence %in% c("A", "B"))} else {return(x)}
} else {return(x)}
}


df %>%
group_by(id) %>%
consequence_select

id consequence
1 1 A
2 1 A
3 1 B
4 1 B

我能够用 plyr 正确地做到这一点:
ddply(df, .(id), consequence_select)

id consequence
1 1 A
2 1 A
3 1 B
4 1 B
5 2 C
6 2 C

最佳答案

dplyr您需要将函数包装在 do 中:

df %>%
group_by(id) %>%
do(consequence_select(.))
.是一个“代词”,指的是数据框 df .

关于r - 使用 dplyr 中的函数合并其他行中的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27008052/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com