gpt4 book ai didi

r - 基于多列组合行并保留所有唯一值

转载 作者:行者123 更新时间:2023-12-04 11:28:25 24 4
gpt4 key购买 nike

我有一个包含用户信息的数据集。对于特定用户,我通常有多行或多或少完整的信息。我想根据 First_Name、Last_Name、Street 总结属于客户的所有行,同时保留其他列的所有信息,如果特定列有两个唯一观察值,我想用“,”折叠它们。

这就是 df 的样子

First_Name Last_Name Street Column1 Colum2 Colum_n

Mike Smith X abc ab a
Mike Smith X abc ad b
John Smith Y xyz xy n
John Smith Y xyz xm NA

我想要的输出是

 First_Name Last_Name Street Column1 Colum2 Colum_n

Mike Smith X abc ab,ad a,b
John Smith Y xyz xy,xm n

我想使用 dplyr 并尝试使用

df %>% 
group_by(First_Name,Last_Name, Street) %>%
summarise_all(funs())

该函数的问题是我只能选择使用平均值或列的第一个出现值之类的值,这意味着值的丢失。我想要的是没有 NA 的所有唯一值的列

最佳答案

您可以编写自己的摘要函数,例如

concat_unique <- function(x){paste(unique(x), collapse=',')}

然后使用 summarize_all(concat_unique)

关于r - 基于多列组合行并保留所有唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53781563/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com