gpt4 book ai didi

r - 列出前 n 个最重复的值,包括其他值

转载 作者:行者123 更新时间:2023-12-04 10:52:37 27 4
gpt4 key购买 nike

我创建了一个表格,其中包含按性别、主题等组织的 1000 首歌曲的列表。我想知道重复了多少年以及有多少在其他类别中。我试过了:

sort(summary(as.factor(canciones$YEAR)), decreasing=T)[1:3]

输出是:
1968 1966 1979 
39 37 34

但我希望它是
1968 1966 1979 Others
39 37 34 950

最佳答案

下面是一些示例数据。

set.seed(1)
x <- sample(10, 500, TRUE)

我们可以运行整个摘要,对前三个进行子集化,然后将剩余的值计算为“其他”并将其添加到最后。此外,我认为您可以使用 table()而不是 summary(factor())summary.factor()无论如何,这都是在幕后进行的。
xx <- sort(table(x), decreasing = TRUE)
c(xx[1:3], Others = sum(xx[-(1:3)]))
# 5 2 4 Others
# 64 61 57 318

注意:使用 Others = length(x) - sum(xx[1:3]) 可能会也可能不会更快.

关于r - 列出前 n 个最重复的值,包括其他值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34296582/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com