r - Dplyr summarise_each 汇总结果-6ren

r - Dplyr summarise_each 汇总结果

转载作者：行者123 更新时间：2023-12-04 11:30:40

25

4

我有一个这样的数据框:

    metric1    metric2    metric3 field1 field2
1   1.07809668  4.2569882  7.1710095      L     S1
2   0.56174763  1.2660273 -0.3751915      L     S2
3   1.17447327  5.5186679 11.6868322      L     S2
4   0.32830724 -0.8374830  1.8973718      S     S2
5  -0.51213503 -0.3076640 10.0730274      S     S1
6   0.24133119  2.7984703 15.9622215      S     S1
7   1.96664414  0.1818531  2.7416768      S     S3
8   0.06669409  3.8652075 10.5066330      S     S3
9   1.14660437  8.5703119  3.4294062      L     S4
10 -0.72785683  9.3320762  1.3827989      L     S4

我正在展示 2 个字段，但还有更多。我需要对按每个字段分组的指标求和，例如对于字段 1:

DF %>% group_by(field1) %>% summarise_each(funs(sum),metric1,metric2,metric3)

我可以对列为 sum(metric1)、sum(metric2)、sum(metric3) 的每个字段执行此操作，但我需要的表输出是这样的:

L(field1) S(field1) S1(field2)  S2(field2) S3(field2)  S4(field2)
sum(metric1)

sum(metric2)

sum(metric3)

我相信必须有一种方法可以使用 tidyr 和 dplyr 来做到这一点，但无法弄清楚

最佳答案

试试 recast来自 reshape2包裹

library(reshape2)
recast(DF, variable ~ field1 + field2, sum)
#   variable     L_S1      L_S2       L_S4       S_S1       S_S2      S_S3
# 1  metric1 1.078097  1.736221  0.4187475 -0.2708038  0.3283072  2.033338
# 2  metric2 4.256988  6.784695 17.9023881  2.4908063 -0.8374830  4.047061
# 3  metric3 7.171010 11.311641  4.8122051 26.0352489  1.8973718 13.248310

这与

dcast(melt(DF, c("field1", "field2")), variable ~ field1 + field2, sum)

您也可以将其与 tidyr::gather 结合使用如果你愿意，但你不能使用 tidyr::spread因为它没有 fun.aggregate争论

DF %>%
  gather(variable, value, -(field1:field2)) %>%
  dcast(variable ~ field1 + field2, sum)
#   variable     L_S1      L_S2       L_S4       S_S1       S_S2      S_S3
# 1  metric1 1.078097  1.736221  0.4187475 -0.2708038  0.3283072  2.033338
# 2  metric2 4.256988  6.784695 17.9023881  2.4908063 -0.8374830  4.047061
# 3  metric3 7.171010 11.311641  4.8122051 26.0352489  1.8973718 13.248310

关于r - Dplyr summarise_each 汇总结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29759455/

25

4

0

文章推荐： .net - ASP.NET : How can I get the domain name without any subdomains?

文章推荐： silverlight - Windows Phone 7 的 MessageBox.Show

文章推荐： ASP.NET 云应用与普通 ASP.NET

文章推荐： r - 如何将调查响应的数据框转换为频率表？

r - 如何使用 summarise_each 计算加权平均值？
如何使用 dplyr 中的 summarise_each 计算数据集中所有字段的加权平均值？例如，假设我们要将分组mtcars 数据集来自气缸并计算所有列的加权平均值，其中权重为齿轮柱子。我已
r - Dplyr summarise_each 汇总结果
我有一个这样的数据框: metric1 metric2 metric3 field1 field2 1 1.07809668 4.2569882 7.1710095
r - dplyr summarise_each 标准误差函数
我可以总结我的数据并使用以下方法计算平均值和标准差值: summary % group_by(year,Spp,CO2) %>% summarise_each(funs(mean,sd)) 但是，我也
r - dplyr summarise_each() 对同一组中的不同列子集使用多个函数
我想使用 summarise_each() 将多个函数应用于分组数据集。但是，我不想将每个函数应用于所有列，而是希望将每个函数应用于特定的子集。我意识到我可以通过使用 summarise() 指定每一
r - 使用 summarise_each 减去某些行的平均值
我有一个包含 30 个变量的数据集。其中之一是指示变量(0 或 1)，我想减去某些列的标签为 1 的行的平均值(类似于居中，但取某些行而不是整列的平均值)。 Col2 Col3 Col4 label
r - Summarise_each 为第一个非 NA 值
有没有办法指导dplyr使用 summarise_each带规范first和 na.rm=TRUE ? 我有一个包含许多 NA 和数值的数据框。 A 列是患者 ID。我想根据患者 ID 通过获取每个变
r - 使用 dplyr 格式化 summarise_each 中的输出
问候:我是 dplyr 的新手，并且在格式化我的输出时遇到了一些挑战。这是一个使用 melt 生成一些可重现数据的代码片段。让它变成我需要的形状。 set.seed(1234) library(res
r - 使用 summarise_each() 计算忽略 NA 的记录
有没有办法使用summarise_each()计算数据框中的记录数，但忽略 NA ? 示例/样本数据 df_sample df_samp var_1 var_2 var_3 var_4 var
r - summarise_each 已弃用 - 新 summarise_at 引发错误
我正在使用以下代码和数据来汇总值: bvsubcount.subset %>% group_by(bv.parentbvid) %>% summarise_each(funs(sum),
r - dplyr summarise() 和 summarise_each() 对提供的函数进行额外调用
看来summarise和 summarise_each正在对它们提供的回调函数进行不必要的额外调用。假设我们有以下 X % group_by( Group ) %>% summarise_each(
r - dplyr summarise_each 与 na.rm
有没有办法指示dplyr将summarise_each与na.rm=TRUE一起使用？我想用 summarise_each("mean") 获取变量的平均值，但我不知道如何指定它来忽略缺失值。最佳答
r - 如何对 mutate_each (和 summarise_each)使用匿名函数？
这个问题已经有答案了: Using anonymous functions with summarize_each or mutate_each (1 个回答) 已关闭 5 年前。众所周知，可以调用
R dplyr summarise_each --> "Error: cannot modify grouping variable"
我正在尝试使用 dplyr 对数据框进行分组和汇总，但不断收到以下错误: Error: cannot modify grouping variable 这是生成它的代码: data_summary %
r - 将 dplyr summarise_each() 与 is.na() 一起使用
我试图将一些 dplyr 魔法包装在一个函数中以生成一个 data.frame，然后我用 xtable 打印它。最终目标是拥有 this 的 dplyr 版本工作和阅读我遇到了非常有用的 summa
在 mutate_each 或 summarise_each 之后以 'canonical' 的方式对列重新排序
以下面的例子为例。 library(dplyr) temp % mutate_each(funs(mean, median)) 检查 temp_each 的名称，我们看到 > names(te
r - dplyr 中的 mutate_each/summarise_each : how do I select certain columns and give new names to mutated columns?
我对 dplyr 动词 mutate_each 有点困惑。使用基本的 mutate 将一列数据转换为 z 分数，并在 data.frame 中创建一个新列(此处名称为 z_score_data):

首页

博学

6Ren·AI

商城

r - Dplyr summarise_each 汇总结果