gpt4 book ai didi

python - 折叠 Pandas 多索引或在多索引数据帧上运行 OLS 回归

转载 作者:太空宇宙 更新时间:2023-11-03 19:15:08 24 4
gpt4 key购买 nike

我使用数据透视来 reshape 数据,现在有一列multiindex。我希望结果列成为简单 OLS 回归中的 X 变量。 Y 是具有相同行索引的另一个系列。

当我尝试运行时

model1 = ols(y = gdp0, x = MIDAS_small)

我明白了

TypeError: can only call with other hierarchical index objects

我可以想象两种解决方案,但无法找出其中之一:

  1. 折叠多重索引。我不会有 ('before', 'var1') 和 ('after', 'var1') 形式的列,而是只有一堆 'beforevar1', 'aftervar1' 等。然后我可以使用 ols 来制作一个漂亮且足够清晰的表格。

  2. 是否有某种方法可以使用多索引运行回归?看起来它的设计部分是为了这类事情,特别是面板回归,但我找不到任何相关的示例或文档。

好吧,我发现了一个不太优雅的解决方案#1:我可以创建一个新的数据帧,循环两个列索引,并将新列插入到具有相同名称的新数据帧中,但名称为字符串而不是元组。一定有一个更优雅的单一命令,对吗?

最佳答案

您是否厌倦了使用 Patsy 的 dmatricies 来准备回归友好的 DataFrame?

示例位于此处:

http://statsmodels.sourceforge.net/devel/gettingstarted.html

我确信您知道 pandas 中的 .unstack() 函数可以让您删除分层索引,但它与 dmatrices 可以产生您正在寻找的结果。

关于python - 折叠 Pandas 多索引或在多索引数据帧上运行 OLS 回归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11586068/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com