gpt4 book ai didi

r - 如何在 R 中执行自举配对 t 检验?

转载 作者:行者123 更新时间:2023-12-04 18:00:44 27 4
gpt4 key购买 nike

我想在 R 中执行自举配对 t 检验。我已经尝试对多个数据集进行此操作,这些数据集在使用参数配对 t 检验时返回 p<.05,但是当我运行 Bootstrap 时,我得到的 p 值介于0.4 和 0.5。我是否运行错误?

   differences<-groupA-groupB
t.test(differences) #To get the t-statistic e.g. 1.96

Repnumber <- 10000
tstat.values <- numeric(Repnumber)
for (i in 1:Repnumber) {
group1 = sample(differences, size=length(differences), replace=T)
tstat.values[i] = t.test(group1)$statistic
}

#### To get the bootstrap p-value compare the # of tstat.values
greater (or lesser) than or equal to the original t-statistic divided
by # of reps:

sum(tstat.values<=-1.96)/Repnumber

谢谢!

最佳答案

您似乎在比较苹果和橙子。对于 differences 的单个 t 检验你会得到一个 t 统计量,如果它大于临界值,则表明 group1 之间的差异是否存在和 group2显着不同于零。您的自举代码做同样的事情,但是对于 differences 的 10,000 个自举样本,为您提供来自 differences 总体的不同随机样本的 t 统计量变化的估计值.如果您采用这些自举 t 统计量 (mean(tstat.values)) 的平均值,您会发现它与 differences 的完整样本中的单个 t 统计量大致相同。 .

sum(tstat.values<=-1.96)/Repnumber为您提供小于 -1.96 的自举 t 统计百分比。这是对从总体中重复随机抽样得到的 t 统计量小于 -1.96 的时间百分比的估计值。我认为这本质上是对您检测 group1 之间给定大小差异的测试能力的估计。和 group2对于给定的样本量和显着性水平,尽管我不确定这种功效分析有多稳健。

就正确引导 t 检验而言,我认为您实际需要做的是某种排列检验,与反复打乱数据标签并执行 t 相比,检查您的实际数据是否异常值-测试每个打乱的数据集。您可能想在 CrossValidated 上提问,以获得有关如何正确处理您的数据的建议。这些经过交叉验证的答案可能会有所帮助:here , here , 和 here .

关于r - 如何在 R 中执行自举配对 t 检验?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35779657/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com