- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个这样的数据框:
metric1 metric2 metric3 field1 field2
1 1.07809668 4.2569882 7.1710095 L S1
2 0.56174763 1.2660273 -0.3751915 L S2
3 1.17447327 5.5186679 11.6868322 L S2
4 0.32830724 -0.8374830 1.8973718 S S2
5 -0.51213503 -0.3076640 10.0730274 S S1
6 0.24133119 2.7984703 15.9622215 S S1
7 1.96664414 0.1818531 2.7416768 S S3
8 0.06669409 3.8652075 10.5066330 S S3
9 1.14660437 8.5703119 3.4294062 L S4
10 -0.72785683 9.3320762 1.3827989 L S4
DF %>% group_by(field1) %>% summarise_each(funs(sum),metric1,metric2,metric3)
L(field1) S(field1) S1(field2) S2(field2) S3(field2) S4(field2)
sum(metric1)
sum(metric2)
sum(metric3)
最佳答案
试试 recast
来自 reshape2
包裹
library(reshape2)
recast(DF, variable ~ field1 + field2, sum)
# variable L_S1 L_S2 L_S4 S_S1 S_S2 S_S3
# 1 metric1 1.078097 1.736221 0.4187475 -0.2708038 0.3283072 2.033338
# 2 metric2 4.256988 6.784695 17.9023881 2.4908063 -0.8374830 4.047061
# 3 metric3 7.171010 11.311641 4.8122051 26.0352489 1.8973718 13.248310
dcast(melt(DF, c("field1", "field2")), variable ~ field1 + field2, sum)
tidyr::gather
结合使用如果你愿意,但你不能使用
tidyr::spread
因为它没有
fun.aggregate
争论
DF %>%
gather(variable, value, -(field1:field2)) %>%
dcast(variable ~ field1 + field2, sum)
# variable L_S1 L_S2 L_S4 S_S1 S_S2 S_S3
# 1 metric1 1.078097 1.736221 0.4187475 -0.2708038 0.3283072 2.033338
# 2 metric2 4.256988 6.784695 17.9023881 2.4908063 -0.8374830 4.047061
# 3 metric3 7.171010 11.311641 4.8122051 26.0352489 1.8973718 13.248310
关于r - Dplyr summarise_each 汇总结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29759455/
如何使用 dplyr 中的 summarise_each 计算数据集中所有字段的加权平均值?例如,假设我们要将 分组mtcars 数据集来自 气缸 并计算所有列的加权平均值,其中权重为 齿轮柱子。我已
我有一个这样的数据框: metric1 metric2 metric3 field1 field2 1 1.07809668 4.2569882 7.1710095
我可以总结我的数据并使用以下方法计算平均值和标准差值: summary % group_by(year,Spp,CO2) %>% summarise_each(funs(mean,sd)) 但是,我也
我想使用 summarise_each() 将多个函数应用于分组数据集。但是,我不想将每个函数应用于所有列,而是希望将每个函数应用于特定的子集。我意识到我可以通过使用 summarise() 指定每一
我有一个包含 30 个变量的数据集。其中之一是指示变量(0 或 1),我想减去某些列的标签为 1 的行的平均值(类似于居中,但取某些行而不是整列的平均值)。 Col2 Col3 Col4 label
有没有办法指导dplyr使用 summarise_each带规范first和 na.rm=TRUE ? 我有一个包含许多 NA 和数值的数据框。 A 列是患者 ID。我想根据患者 ID 通过获取每个变
问候:我是 dplyr 的新手,并且在格式化我的输出时遇到了一些挑战。这是一个使用 melt 生成一些可重现数据的代码片段。让它变成我需要的形状。 set.seed(1234) library(res
有没有办法使用summarise_each()计算数据框中的记录数,但忽略 NA ? 示例/样本数据 df_sample df_samp var_1 var_2 var_3 var_4 var
我正在使用以下代码和数据来汇总值: bvsubcount.subset %>% group_by(bv.parentbvid) %>% summarise_each(funs(sum),
看来summarise和 summarise_each正在对它们提供的回调函数进行不必要的额外调用。假设我们有以下 X % group_by( Group ) %>% summarise_each(
有没有办法指示dplyr将summarise_each与na.rm=TRUE一起使用?我想用 summarise_each("mean") 获取变量的平均值,但我不知道如何指定它来忽略缺失值。 最佳答
这个问题已经有答案了: Using anonymous functions with summarize_each or mutate_each (1 个回答) 已关闭 5 年前。 众所周知,可以调用
我正在尝试使用 dplyr 对数据框进行分组和汇总,但不断收到以下错误: Error: cannot modify grouping variable 这是生成它的代码: data_summary %
我试图将一些 dplyr 魔法包装在一个函数中以生成一个 data.frame,然后我用 xtable 打印它。 最终目标是拥有 this 的 dplyr 版本工作和阅读我遇到了非常有用的 summa
以下面的例子为例。 library(dplyr) temp % mutate_each(funs(mean, median)) 检查 temp_each 的名称,我们看到 > names(te
我对 dplyr 动词 mutate_each 有点困惑。 使用基本的 mutate 将一列数据转换为 z 分数,并在 data.frame 中创建一个新列(此处名称为 z_score_data):
我是一名优秀的程序员,十分优秀!