gpt4 book ai didi

python - 为什么使用 statsmodels 执行 OLS 和使用 scikit 执行 PooledOLS 时会得到相同的结果?

转载 作者:太空宇宙 更新时间:2023-11-03 20:21:22 30 4
gpt4 key购买 nike

我目前正在使用 python 做一个机器学习项目(这里是初学者,从头开始学习一切)。

只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据集有什么区别。我尝试了两者,他们给了我相同的结果。这是否意味着他们本质上是在做同样的事情,但来自不同的包?我应该得到相同的结果吗?还是我做错了什么?

我的数据集如下所示:

                  excessreturnlag1m      ROA  ...  momentum6m  momentum12m
bank date ...
bankA 2019-06-30 -14.564600 0.9795 ... 0.14 -0.24
2019-05-31 7.522300 0.9795 ... -0.69 -1.97
2019-04-30 -2.020400 0.9795 ... 1.36 -1.70
bankB 2019-06-30 -5.969600 0.9915 ... -0.39 -1.77
2019-05-31 0.220200 0.9915 ... -0.24 -2.00
2019-04-30 -1.900000 0.9915 ... -0.06 -1.42
bankC 2019-06-30 2.721700 0.9763 ... -0.38 -1.13
2019-05-31 -8.418900 0.9763 ... -1.28 -1.19
2019-04-30 -1.001100 0.9763 ... -3.06 -1.16

我的数据框中目前有一个多重索引(银行和日期)。我应该用它来进行面板回归吗?

编辑:据我了解,PooledOLS 是多元线性回归的“特殊”情况,因此它会给出与 statsmodels 的 OLS 相同的结果吗?如果我错了请纠正我!

最佳答案

OLS :普通最小二乘法只是一种简单的计算方法
根据如何求解正规方程,实现可能会有所不同,但测量执行时间可能是好的,因为计算量存在差异。

关于python - 为什么使用 statsmodels 执行 OLS 和使用 scikit 执行 PooledOLS 时会得到相同的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58142908/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com