gpt4 book ai didi

python - Pandas 中 R 的 lm 函数

转载 作者:太空宇宙 更新时间:2023-11-04 00:30:14 27 4
gpt4 key购买 nike

我在 R 中有以下 lm 函数:

in_data <- c(0.5, 0.6, 0.7)
minutes <- c(30, 60, 90)
foobar <- lm(log(in_data) ~ 0 + hours)

问题

  • 我理解 ~ 运算符用于分隔左和模型公式的右侧。所以在这种情况下,是否转换为 log(in_data) 取决于 0 和 hours???我完全迷失在这里,尤其是向量的对数如何依赖于 0 和另一个向量
  • 如果我尝试将其移植到 Pandas,最直接的方法是什么?我尝试了以下内容:

.

import statsmodels.formula.api as sm
import numpy as np
result = sm.ols(formula="np.log(in_data) ~ 0 + minutes", data=model_data).fit()

但这引发了一个错误:

patsy.PatsyError: Number of rows mismatch between data argument and np.log(in_data) (1 versus 4)
np.log(in_data) ~ 0 + minutes
^^^^^^^^^^^^^^^^^

最佳答案

多元线性回归方程的形式为 y = b0 + b1x1 + b2x2 + ... +bkxk 其中 b0 是截距或常数。您可以通过在 R 中使用 0 + 从模型中排除这个常量。另一种方法是使用 - 1,它在 R 和 patsy 中都有效。因此,您需要将结果更改为:

result = sm.ols(formula="np.log(in_data) ~ minutes - 1", data=model_data).fit()

关于python - Pandas 中 R 的 lm 函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46083644/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com