gpt4 book ai didi

r - 使用 dplyr 计算 95%-CI 的长度

转载 作者:行者123 更新时间:2023-12-04 02:45:10 24 4
gpt4 key购买 nike

上次我问到如何为多个受访者重复测量的变量(procras)计算每个测量时机(周)的平均分数。所以我的(简化的)长格式数据集如下所示(这里有两个学生和 5 个时间点,没有分组变量):

studentID  week   procras
1 0 1.4
1 6 1.2
1 16 1.6
1 28 NA
1 40 3.8
2 0 1.4
2 6 1.8
2 16 2.0
2 28 2.5
2 40 2.8

使用 dplyr 我会得到每个测量场合的平均分数
mean_data <- group_by(DataRlong, week)%>% summarise(procras = mean(procras, na.rm = TRUE))

看起来像这样,例如:
Source: local data frame [5 x 2]
occ procras
(dbl) (dbl)
1 0 1.993141
2 6 2.124020
3 16 2.251548
4 28 2.469658
5 40 2.617903

使用 ggplot2,我现在可以绘制随时间的平均变化,并且通过轻松调整 dplyr 的 group_data(),我还可以获得每个子组的平均值(例如,男性和女性每个场合的平均得分)。
现在,我想在 mean_data 表中添加一列,其中包括围绕每个场合的平均分数的 95%-CI 的长度。

http://www.cookbook-r.com/Graphs/Plotting_means_and_error_bars_(ggplot2)/解释了如何获取和绘制 CI,但是一旦我想对任何子组执行此操作,这种方法似乎就会出现问题,对吗?那么有没有办法让 dplyr 在 mean_data 中自动包含 CI(基于组大小等)?
之后,将新值作为 CI 绘制到我希望的图表中应该相当容易。
谢谢你。

最佳答案

您可以使用 mutate 手动执行此操作summarise 中的一些额外功能

library(dplyr)
mtcars %>%
group_by(vs) %>%
summarise(mean.mpg = mean(mpg, na.rm = TRUE),
sd.mpg = sd(mpg, na.rm = TRUE),
n.mpg = n()) %>%
mutate(se.mpg = sd.mpg / sqrt(n.mpg),
lower.ci.mpg = mean.mpg - qt(1 - (0.05 / 2), n.mpg - 1) * se.mpg,
upper.ci.mpg = mean.mpg + qt(1 - (0.05 / 2), n.mpg - 1) * se.mpg)

#> Source: local data frame [2 x 7]
#>
#> vs mean.mpg sd.mpg n.mpg se.mpg lower.ci.mpg upper.ci.mpg
#> (dbl) (dbl) (dbl) (int) (dbl) (dbl) (dbl)
#> 1 0 16.61667 3.860699 18 0.9099756 14.69679 18.53655
#> 2 1 24.55714 5.378978 14 1.4375924 21.45141 27.66287

关于r - 使用 dplyr 计算 95%-CI 的长度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35953394/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com