gpt4 book ai didi

python - 为什么 OLS 回归模型中除了第一个(截距)之外的所有系数都获得非常接近零(e^-17 或低)的值?

转载 作者:行者123 更新时间:2023-12-01 01:18:53 29 4
gpt4 key购买 nike

我使用 statsmodels 包在 python 中编写了以下代码,以创建 OLS 回归模型。我尝试了使用不同数据集的代码,并得到了除第一个(截距)系数外所有系数值都接近零的模型。代码可能有什么问题?

data1 = pandas.concat([Y, X], axis = 1)
dta = lagmat2ds(data1, mxlg, trim='both', dropex=1)
dtaown = sm.add_constant(dta[:, 0:(mxlg + 1)], prepend = False)
dtajoint = sm.add_constant(dta[:, 0:], prepend = False)
res2down = sm.OLS(dta[:, 0], dtaown).fit()
res2djoint = sm.OLS(dta[:, 0], dtajoint).fit()

Here the sm is statsmodels.api as sm and for sample testing you can consider the dataset sm.datasets.spector.

最佳答案

数据的结构方式 - 您正在建模 YY|lag Y|constant。请注意,OLS 文档 ( https://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.html ) 指出 -

No constant is added by the model unless you are using formulas.

因此,您看到的第一个值不是截距,而是拟合 YY 的系数 - 将为 1.0

您可以尝试检查是否获得了合理的结果,即从预测变量中排除 Y,如下所示 -

res2down = sm.OLS(dta[:, 0], dtaown[:, 1:]).fit()

关于python - 为什么 OLS 回归模型中除了第一个(截距)之外的所有系数都获得非常接近零(e^-17 或低)的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54035907/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com