gpt4 book ai didi

r - 计算误差线并将误差线添加到 ggplot2 直方图的好方法是什么?

转载 作者:行者123 更新时间:2023-12-04 04:55:35 26 4
gpt4 key购买 nike

以下命令生成一个简单的直方图:

g<- ggplot(data = mtcars, aes(x = factor(carb) )) + geom_histogram()

通常我会像这样在我的图中添加错误栏:
g+stat_summary(fun.data="mean_cl_boot",geom="errorbar",conf.int=.95)

但这不适用于直方图(“错误:geom_errorbar 需要以下缺失的美学:ymin,ymax
"),我认为因为 y 变量不是显式的 - 计数是由 geom_histogram 自动计算的,所以没有声明 y 变量。

我们是否无法使用 geom_histogram 而必须首先自己计算 y 数量(计数),然后通过调用 geom_bar 将其指定为 y 变量?

最佳答案

似乎确实不能使用 geom_histogram 而我们必须手动计算计数(条形高度)和置信区间限制。首先,计算计数:

library(plyr)
mtcars_counts <- ddply(mtcars, .(carb), function(x) data.frame(count=nrow(x)))

剩下的问题是计算二项式比例的置信区间,这里是计数除以数据集中的病例总数。文献中提出了多种公式。在这里,我们将使用在 PropCIs 库中实现的 Agresti & Coull (1998) 方法。
library(PropCIs)
numTotTrials <- sum(mtcars_counts$count)

# Create a CI function for use with ddply and based on our total number of cases.
makeAdd4CIforThisHist <- function(totNumCases,conf.int) {
add4CIforThisHist <- function(df) {
CIstuff<- add4ci(df$count,totNumCases,conf.int)
data.frame( ymin= totNumCases*CIstuff$conf.int[1], ymax = totNumCases*CIstuff$conf.int[2] )
}
return (add4CIforThisHist)
}

calcCI <- makeAdd4CIforThisHist(numTotTrials,.95)

limits<- ddply(mtcars_counts,.(carb),calcCI) #calculate the CI min,max for each bar

mtcars_counts <- merge(mtcars_counts,limits) #combine the counts dataframe with the CIs

g<-ggplot(data =mtcars_counts, aes(x=carb,y=count,ymin=ymin,ymax=ymax)) + geom_bar(stat="identity",fill="grey")
g+geom_errorbar()

resulting graph

关于r - 计算误差线并将误差线添加到 ggplot2 直方图的好方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16788152/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com