gpt4 book ai didi

r - summary.rq 输出取决于样本大小

转载 作者:行者123 更新时间:2023-12-05 06:29:11 25 4
gpt4 key购买 nike

我发现(见下文)函数 summary.rq (第 88 页)来自 quantreg 包打印不同的输出,这取决于样本量是大于等于还是小于 1001。

我知道,rq() 使用不同的方法,具体取决于样本大小是大于等于还是小于 1001。我认为这就是这种行为的原因。

显示所描述行为的 MWE:

> library(quantreg)
> x <- seq(0, 100, length.out = 1000)
> e <- rnorm(1000, mean = 0, sd = 1.2)
> y <- 6 + 0.1 * x + e
> summary(rq(y ~ x, tau = 0.025))

Call: rq(formula = y ~ x, tau = 0.025)

tau: [1] 0.025

Coefficients:
coefficients lower bd upper bd
(Intercept) 3.67733 2.92776 3.88165
x 0.10061 0.09578 0.10675
Warning message:
In rq.fit.br(x, y, tau = tau, ci = TRUE, ...) : Solution may be
nonunique

> x <- seq(0, 100, length.out = 1001)
> e <- rnorm(1001, mean = 0, sd = 1.2)
> y <- 6 + 0.1 * x + e
> summary(rq(y ~ x, tau = 0.025))

Call: rq(formula = y ~ x, tau = 0.025)

tau: [1] 0.025

Coefficients:
Value Std. Error t value Pr(>|t|)
(Intercept) 3.61744 0.28052 12.89559 0.00000
x 0.10033 0.00477 21.04017 0.00000

这是期望的行为吗?对于大于 1000 的样本量,如何获得第一种形式的输出?

我的问题是,我在多个样本大小的循环中使用 summary.rq 函数,并希望使用下限和上限值。

最佳答案

输出之间的差异不是来自 rq(),而是来自 summary.rq()quantreg 对小于 1000 的样本量使用“rank”推理方法,否则使用“nid”。帮助文件表明,对于较大的样本量,“排名”方法可能会非常慢。如果您坚持让前一个输出出现在所有循环研究中,那么您可以指定

summary(rq(y ~ x, tau = 0.025),se="rank")

但是,更仔细地研究一下可能会更好地为您服务。例如,如果您的一些研究的样本量非常大,计算可能会变得非常慢,您可能需要为所有研究指定 se="nid" 并手动计算上限和下限( upper=Value + 1.96*Std.Errorlower=Value - 1.96*Std.Error

关于r - summary.rq 输出取决于样本大小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53765991/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com