gpt4 book ai didi

r - dplyr:组数的平均值

转载 作者:行者123 更新时间:2023-12-04 02:15:15 24 4
gpt4 key购买 nike

我正在尝试使用 dplyr 查找数据帧上变量的平均长度:

x <- data %>% group_by(Date, `% Bucket`) %>% summarise(count = n())

Date % Bucket count
(date) (fctr) (int)
1 2015-01-05 <=1 1566
2 2015-01-05 (1-25] 421
3 2015-01-05 (25-50] 461
4 2015-01-05 (50-75] 485
5 2015-01-05 (75-100] 662
6 2015-01-05 (100-150] 1693
7 2015-01-05 >150 12359
8 2015-01-13 <=1 1608
9 2015-01-13 (1-25] 441
10 2015-01-13 (25-50] 425

如何使用 dplyr 汇总以找到一年中每个 % Bucket 的平均值?

in base:
x <- as.data.frame(x)
aggregate(count ~ `% Bucket`, data = x, FUN=mean)

% Bucket count
1 <=1 2609.5294
2 (1-25] 449.0000
3 (25-50] 528.7059
4 (50-75] 593.2157
5 (75-100] 763.0000
6 (100-150] 1758.6667
7 >150 12457.9216

聚合函数将采用 dplyr 在上面的每个桶中找到的计数并将它们相加,除以包含该 % Bucket 变量的行数并给出上面的答案。我怎样才能用 dplyr 完成这个呢?这不是要完成问题,而是要了解如何在这种情况下使用 dplyr 包。

这种类型的另一个例子是总结每个group_by变量的n()并且列出最小长度“count "在 52 周内该变量的百分比。

我很挣扎,因为 dplyr 似乎是为了在列中找到一个值的平均值而构建的,但在这里我正在计算列中给定变量的行出现次数,并试图找到平均值、最小值、最大值、等等。

最佳答案

我们可以使用dplyr方法

library(dplyr)
x %>%
group_by(`% Bucket`) %>%
summarise(count= mean(count))

关于r - dplyr:组数的平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34530428/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com