gpt4 book ai didi

regression - 在Python中模拟回归线的数据

转载 作者:行者123 更新时间:2023-11-30 23:45:36 25 4
gpt4 key购买 nike

如果我有一条回归线和一个 r 平方,是否有一个简单的 numpy (或其他一些 python 库)命令来随机绘制与回归一致的 x 的 y 值?您可以用同样的方式从分布中抽取随机值吗?

谢谢!

编辑:我有回归线的方程和 r^2 值。 r^2 值应该提供一些有关我的线周围数据点分布的信息,不是吗?如果我只是调用 y=random.gauss()*x+b 我不是丢失了 r^2 中的信息吗?或者这会被纳入 stdv 中吗?如果是的话,如何纳入?抱歉,我之前很少使用回归。

最佳答案

幸运的是,不需要暴力:)。要获得 R^2 和残差标准差之间的关系,最简单的方法是从 R^2 的定义开始:

R^2 = SSR / SST    (1)

其中 SSR 是回归的平方和,即 (sum((y'-mean(y))^2) 其中 y' 是回归线上的值,SST 是平方和,即 sum((y - Mean(y))^2) where y 是观测值。实际上,R^2 是方差总量与回归模型(或线)解释的方差量之间的分数。出于我们的目的,我们需要重新将 SSR 表示为 SST - SSE,其中 SSE 是回归线与观测值之间的平方和。SSE > 是回归模型无法解释的方差。重写(1):

R^2 = (SST - SSE) / SST = 1 - SSE / SST

表示SSE:

SSE = (1 - R^2) SST

如果我们注意到要求方差的平方和,我们需要除以 N-1 这将变为:

VAR_E = (1 - R^2) VAR_T

获取残差的标准差:

SD_E = sqrt((1 - R^2) VAR_T)

并将 VAR 从括号中取出:

SD_E = sqrt(1 - R^2) SD_T

因此您需要R^2 和数据集的总标准差。要验证这一点,请查看任何介绍性统计书籍。

关于regression - 在Python中模拟回归线的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9428704/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com