gpt4 book ai didi

r - 多个变量的分组描述性统计

转载 作者:行者123 更新时间:2023-12-02 21:32:22 30 4
gpt4 key购买 nike

给定数据框(df)

Hup Hop testA   testB
Y Hi 1 1
N Lo 2 2
Y Mi 3 3
N No 4 4
Y Hi 5 5
N Lo 6 6
Y Mi 7 7
N No 8 8
Y Hi 9 9
N Lo 10 10
Y Mi 11 11
N No 12 12

我想要 testA 和 testB 的分组变量 Hup 和 Hop 的描述性统计数据(均值和标准差)。我想要这样的东西。

hup testA.mean  testA.sd    testB.mean  testB.sd
y 7 3.742 7 3.742
n 6 3.742 6 3.742
hop testA.mean testA.sd testB.mean testB.sd
hi etc Etc etc Etc
lo etc Etc etc Etc
mi etc Etc etc Etc

使用例如 ddply(df,~hup,summarise,mean=round(mean(testA),3),sd=round(sd(testA),3)) 可以解决一部分的问题。但我想加快这个过程:学习如何使用 R。所以,我想:

lapply(df[ , c("testA", "testB")], function(x){ ddply(df, ~df[ , c("hup")], function(x) {意思(x)} )})

这不起作用,它返回 NA,错过 SD 并且仅报告 hup 的结果。

问:如何为具有多个变量的多个组生成描述性统计数据?

最佳答案

对于显示,我认为 tables 包中的 tabular 函数是最简单的:

library(tables)
tabular(Hup + Hop ~ (testA + testB)*((n = 1) + mean + sd), data = df)
## testA testB
## mean sd n mean sd n
##Hup N 7 3.742 6 7 3.742 6
## Y 6 3.742 6 6 3.742 6
##Hop Hi 5 4.000 3 5 4.000 3
## Lo 6 4.000 3 6 4.000 3
## Mi 7 4.000 3 7 4.000 3
## No 8 4.000 3 8 4.000 3

您还可以将 tabular() 对象包装在 latex() 中,以 LaTeX 语法输出表格。

关于r - 多个变量的分组描述性统计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22066438/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com