gpt4 book ai didi

R - 聚合因子/字符变量

转载 作者:行者123 更新时间:2023-12-04 04:48:26 24 4
gpt4 key购买 nike

我有这种数据框:

df<- data.frame(cluster=c('1','1','2','3','3','3'), class=c('A','B','C','B','B','C'))

我想为每个集群 (1,2,3) 获取最常出现的类。在平局的情况下,获得信息也是很好的,例如类的组合(或者如果不可能只有 NA)。
所以对于我的例子,我想要这样的结果:
 cluster  class.max
1 'A B' (or NA)
2 'C'
3 'B'

也许我应该使用 aggregate()但不知道如何。

最佳答案

rank有处理关系的方法:

aggregate(class~cluster,df,function(x) paste(names(table(x)[rank(-1*table(x),ties.method="min")==1]),collapse=" "))
cluster class
1 1 A B
2 2 C
3 3 B

关于R - 聚合因子/字符变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17811195/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com