gpt4 book ai didi

python - Statsmodels - OLS Clustered Standard Errors(不接受来自 DF 的系列?)

转载 作者:行者123 更新时间:2023-11-28 16:29:15 25 4
gpt4 key购买 nike

我正在运行一项分析,该分析可以从 BEA 区域的聚类中获益。我之前没有在 Statsmodels 中使用过集群标准错误选项,所以我不清楚我是在搞乱语法,还是这个选项被破坏了。任何帮助将不胜感激。

这里是代码的相关部分(注意 topline_specs 字典返回 Patsy 风格的公式):

#Capture topline specs
topline_specs={'GO':spec_dict['PC_GO']['Total']['TYPE']['BOTH'],
'RV':spec_dict['PC_RV']['Total']['TYPE']['BOTH'],
'ISSUER':spec_dict['PROP']['ISSUER']['TYPE']['BOTH'],
'PURPOSE':spec_dict['PROP']['PURPOSE']['TYPE']['BOTH']}

#Estimate each model
topline_mods={'GO':smf.ols(formula=topline_specs['GO'],data=data_d).fit(cov_type='cluster',
cov_kwds={'groups':data_d['BEA_INT']})}

topline_mods['GO']

回溯源于一次 numpy 调用。它返回以下内容:

ValueError: The weights and list don't have the same length.

我能找到的关于使用聚类标准错误的所有内容看起来都像 cov_kwds 参数可以从包含模型数据的 DataFrame 中获取一个 Series。我错过了什么?

最佳答案

当使用公式创建模型时,缺失值处理默认为“drop”,并且从提供给模型的所有数据数组中删除具有缺失观察值的行 (__init__)。在非公式界面中,目前默认为忽略缺失值。

但是,目前没有检查和自动删除稍后给出的数组中的缺失值,在这种情况下,cov_kwds 中需要数据。如果这具有原始观察集,但一些已被删除到因变量和解释变量中,则将存在长度不匹配,并且会引发报告的异常。

我重新打开了https://github.com/statsmodels/statsmodels/issues/1220因为在我们通过 pandas 索引获得足够信息的特殊情况下,可以处理缺失值。

关于python - Statsmodels - OLS Clustered Standard Errors(不接受来自 DF 的系列?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33712400/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com