gpt4 book ai didi

r - 自举样本结果变量是否与 R 回归中的 x 值相关联

转载 作者:行者123 更新时间:2023-12-04 04:10:28 28 4
gpt4 key购买 nike

我正在尝试对 R 中的引导样本运行回归。

原始样本看起来像这个数据框(称为 df)并且有数百个条目。 Y为结果变量,treat为0或1。

y  treat
3 0
5 1
2 0
4 1

我已经通过放回抽样从 df$y 生成 900 个观测值。

set.seed(5)
b1 <- sample(df$y, 900, replace = TRUE, prob = NULL)

然后我运行了以下回归。

lm(b1 ~ treat, df)

当使用样本 b1 作为回归结果时,这是否会自动将 b1 的正确值与原始数据框中的处理值相匹配?如果我希望 b1 中的结果值与原始数据框中的正确处理值相对应,我是否需要做一些不同的事情?我如何检查这是否是我要运行的回归?

最佳答案

我们可以对行序列而不是单个列进行采样。在 OP 的代码中,它只是对“y”进行采样,而“treat”仅包含 4 个元素,当我们应用公式方法时,这将导致错误,因为其中一个对象具有不同的长度。

lm(b1 ~ treat, df)   

Error in model.frame.default(formula = b1 ~ treat, data = df, drop.unused.levels = TRUE) : variable lengths differ (found for 'treat')

相反,我们对行序列进行采样

set.seed(5)
df1 <- df[sample(seq_len(nrow(df)), 900, replace = TRUE),]
lm(y ~ treat, df1)

数据

df <- structure(list(y = c(3L, 5L, 2L, 4L), treat = c(0L, 1L, 0L, 1L
)), class = "data.frame", row.names = c(NA, -4L))

关于r - 自举样本结果变量是否与 R 回归中的 x 值相关联,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61828008/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com