gpt4 book ai didi

r - 使用 dplyr 进行多组汇总

转载 作者:行者123 更新时间:2023-12-02 08:21:14 25 4
gpt4 key购买 nike

我正在尝试使用 dplyr 来总结基于两个组的数据集:“年”和“区域”。这是数据集的样子:

  Year   Area Num
1 2000 Area 1 99
2 2001 Area 3 85
3 2000 Area 1 60
4 2003 Area 2 90
5 2002 Area 1 40
6 2002 Area 3 30
7 2004 Area 4 10
...

最终结果应该是这样的:

  Year    Area Mean
1 2000 Area 1 100
2 2000 Area 2 80
3 2000 Area 3 89
4 2001 Area 1 80
5 2001 Area 2 85
6 2001 Area 3 59
7 2002 Area 1 90
8 2002 Area 2 88
...

请原谅“平均值”的值,它们是编造的。

示例数据集的代码:

df <- structure(list(
Year = c(2000, 2001, 2000, 2003, 2002, 2002, 2004),
Area = structure(c(1L, 3L, 1L, 2L, 1L, 3L, 4L),
.Label = c("Area 1", "Area 2", "Area 3", "Area 4"),
class = "factor"),
Num = structure(c(7L, 5L, 4L, 6L, 3L, 2L, 1L),
.Label = c("10", "30", "40", "60", "85", "90", "99"),
class = "factor")),
.Names = c("Year", "Area", "Num"),
class = "data.frame", row.names = c(NA, -7L))

df$Num <- as.numeric(df$Num)

我尝试过的事情:

df.meanYear <- df %>%
group_by(Year) %>%
group_by(Area) %>%
summarize_each(funs(mean(Num)))

但它只是将每个值替换为平均值,而不是预期的结果。

如果可能,请提供替代方法(即非 dplyr)方法,因为我还是 R 的新手。

最佳答案

这是您要找的吗?

 library(dplyr)
df <- group_by(df, Year, Area)
df <- summarise(df, avg = mean(Num))

关于r - 使用 dplyr 进行多组汇总,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36893812/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com