gpt4 book ai didi

python statsmodels.formula.api.ols : ValueError: For numerical factors, num_columns 必须是 int

转载 作者:行者123 更新时间:2023-12-01 03:33:07 33 4
gpt4 key购买 nike

我正在尝试从 statsmodels.api.anova_lm 的帮助字符串中重现该示例:

import statsmodels.api as sm
from statsmodels.formula.api import ols

moore = sm.datasets.get_rdataset("Moore", "car",
cache=True) # load data
data = moore.data
data = data.rename(columns={"partner.status" :
"partner_status"}) # make name pythonic
moore_lm = ols('conformity ~ C(fcategory, Sum)*C(partner_status, Sum)',
data=data).fit()

table = sm.stats.anova_lm(moore_lm, typ=2) # Type 2 ANOVA DataFrame
print table

但是,我从 moore_lm = ols('conformity ~ C(fcategory, Sum)*C(partner_status, Sum)', data=data) 收到以下错误消息:

ValueError: For numerical factors, num_columns must be an int

数据如下所示:

>>> print data
partner_status conformity fcategory fscore
0 low 8 low 37
1 ... ... ... ...

我对我真正感兴趣的数据集遇到了同样的问题;那么是什么原因导致这个错误呢?

顺便说一下,C(<column>, Sum) 是什么意思?做什么?

最佳答案

更新馅饼:

 pip install https://github.com/pydata/patsy/archive/master.zip 

就我而言,它是从版本 0.4 到“0.4.1+dev”

“C”代表分类变量

关于python statsmodels.formula.api.ols : ValueError: For numerical factors, num_columns 必须是 int,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40649926/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com