gpt4 book ai didi

python - 使用 bootstrap 获取线性回归系数的标准误差

转载 作者:行者123 更新时间:2023-12-01 09:04:13 24 4
gpt4 key购买 nike

我想使用引导技术(100次重采样)计算线性回归系数的标准误差,但我得到的结果为零,这是不正常的。我认为代码的引导部分有问题。你知道如何修复我的代码吗?

x, y = np.genfromtxt("input.txt", unpack=True) 

#regression part
slope, intercept, r_value, p_value, std_err = stats.linregress(x,y)
print std_err

#bootstrap part of the code
A = np.random.choice(x, size=100, replace=True)
B = np.random.choice(y, size=100, replace=True)
slope2, intercept2, r_value2, p_value2, std_err2 = stats.linregress(A,B)
print std_err2

输入.txt:

-1.08   -1.07
-2.62 -2.56
-2.84 -2.79
-2.22 -2.16
-3.47 -3.55
-2.81 -2.79
-2.86 -2.71
-3.41 -3.42
-4.18 -4.21
-3.50 -3.48
-5.67 -5.55
-6.83 -6.95
-6.13 -6.13
-8.34 -8.19
-7.82 -7.83
-9.86 -9.58
-8.67 -8.62
-9.81 -9.81
-8.39 -8.30

最佳答案

我在 Python 3.6.1 中运行上述代码没有任何问题。也许检查一下你的 scipy 版本是否是最新的?

from scipy import stats
import numpy as np

x, y = np.genfromtxt("./input.txt", unpack=True)
slope_1, intercept_1, r_val_1, p_val_1, stderr_1 = stats.linregress(x, y)
print(slope_1) # 0.9913080927081567
print(stderr_1) # 0.007414734102169809

A = np.random.choice(x, size=100, replace=True)
B = np.random.choice(y, size=100, replace=True)

slope_2, incercept_2, r_val_2, p_val_2, stderr_2 = stats.linregress(A, B)
print(slope_2) # 0.11429903085322253
print(stderr_2) # 0.10158283281966374
<小时/>

正确引导数据

执行此操作的正确方法是使用 sklearn.utils 中的 resample 方法。此方法以一致的数组格式处理数据。由于您的数据是 x, y 对,因此 y 值取决于您的 x 值。如果您独立随机对 x 和 y 进行采样,您就会失去这种依赖性,并且重新采样的数据将无法准确代表您的总体。

from scipy import stats
from sklearn.utils import resample
import numpy as np

x, y = np.genfromtxt("./input.txt", unpack=True)
slope_1, intercept_1, r_val_1, p_val_1, stderr_1 = stats.linregress(x, y)
print(slope_1) # 0.9913080927081567
print(stderr_1) # 0.007414734102169809

A, B = resample(x, y, n_samples=100) # defaults to w/ replacement

slope_2, incercept_2, r_val_2, p_val_2, stderr_2 = stats.linregress(A, B)
print(slope_2) # 0.9864339054638176
print(stderr_2) # 0.002669659193615103

关于python - 使用 bootstrap 获取线性回归系数的标准误差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52203828/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com