- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想使用 pandas OLS 函数为我的数据系列拟合趋势线。有谁知道如何使用 pandas 系列中的日期时间索引作为 OLS 中的预测变量?
例如,假设我有一个简单的时间序列:
>>> ts
2001-12-31 19.828763
2002-12-31 20.112191
2003-12-31 19.509116
2004-12-31 19.913656
2005-12-31 19.701649
2006-12-31 20.022819
2007-12-31 20.103024
2008-12-31 20.132712
2009-12-31 19.850609
2010-12-31 19.290640
2011-12-31 19.936210
2012-12-31 19.664813
Freq: A-DEC
我想使用索引作为预测变量对其进行 OLS:
model = pd.ols(y=ts,x=ts.index,intercept=True)
但由于 x 是日期时间索引的列表,函数返回错误。有人有想法吗?
我可以使用 scipy.stats 中的 linregress,但我想知道 Pandas 是否可行。
谢谢,格雷格
最佳答案
问题是您不能将 Index
传递给 ols
。
将其更改为 Series
:
In [153]: ts
Out[153]:
2011-01-01 00:00:00 19.828763
2011-01-01 01:00:00 20.112191
2011-01-01 02:00:00 19.509116
Freq: H, Name: 1
In [158]: type(ts.index)
Out[158]: pandas.tseries.index.DatetimeIndex
In [154]: df = ts.reset_index()
In [155]: df
Out[155]:
index 1
0 2011-01-01 00:00:00 19.828763
1 2011-01-01 01:00:00 20.112191
2 2011-01-01 02:00:00 19.509116
In [160]: type(df['index'])
Out[160]: pandas.core.series.Series
In [156]: model = pd.ols(y=df[1], x=df['index'], intercept=True)
In [163]: model
Out[163]:
-------------------------Summary of Regression Analysis-------------------------
Formula: Y ~ <x> + <intercept>
Number of Observations: 3
Number of Degrees of Freedom: 1
R-squared: -0.0002
Adj R-squared: -0.0002
Rmse: 0.3017
F-stat (1, 2): -inf, p-value: 1.0000
Degrees of Freedom: model 0, resid 2
-----------------------Summary of Estimated Coefficients------------------------
Variable Coef Std Err t-stat p-value CI 2.5% CI 97.5%
--------------------------------------------------------------------------------
x 0.0000 0.0000 0.00 0.9998 -0.0000 0.0000
intercept 0.0000 76683.4934 0.00 1.0000 -150299.6471 150299.6471
---------------------------------End of Summary---------------------------------
关于python - OLS 与 Pandas : datetime index as predictor,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14361634/
我目前正在处理具有 2 列的数据框(在 pandas 中):第一列是一些数字量化数据,例如体重、某天花费的金额、GPA 等., 第二列是日期值,即添加相应列 1 条目的日期。 我想知道,在 Pytho
我无法使 ROC 函数工作,出现错误“预测器必须是数字或有序”。 我浏览了其他帖子,但没有解决我的问题。任何帮助都受到高度赞赏。 "Get data" flying=dget("https://www
我是使用python的新手,我想运行此代码,但出现此错误。 码: # construct the argument parse and parse the arguments ap = argpars
所以我尝试在 R 中运行“genie3”算法(引用:http://homepages.inf.ed.ac.uk/vhuynht/software.html),它使用“randomForest”方法。
我有一个锦标赛分支预测器模拟作为作业。该程序模拟微处理器中的锦标赛分支预测器。我想我做的一切都是对的。我无法追踪问题。我陷入了段错误。 /* Shreyas Kale Computer Archite
我是 python 新手,找不到答案。引用消息末尾的代码,我能知道下面一行中的“for item, total in totals.items()”是什么意思吗? rankings = [(total
我有以下变量,如果它们是宽格式,我会计算类似 lm(happiness ~ personality_trait*condition) 但是我的数据是长格式的。 我想这将是一个重复测量模型,但我不确定。
我是 R 新手,遇到了这个问题:我想比较两种预测技术(支持向量机和神经网络),将它们应用于某些数据,并且我想比较它们的性能。为此,我使用 ROC 曲线。该代码应该计算 ROC 曲线下的面积,但它不起作
我想使用 pandas OLS 函数为我的数据系列拟合趋势线。有谁知道如何使用 pandas 系列中的日期时间索引作为 OLS 中的预测变量? 例如,假设我有一个简单的时间序列: >>> ts 200
请求帮助解决以下错误。 An error occurred (ModelError) when calling the InvokeEndpointoperation: Received client
我一直在尝试通过我的 vm 实例上的控制台将我的模型部署到 AI 平台进行预测,但我收到错误“(gcloud.beta.ai-platform.versions.create)创建版本失败。模型错误检
到目前为止,我使用的是 tf.contrib.predictor.from_saved_model加载 SavedModel ( tf.estimator 模型类)。然而,不幸的是,这个功能在 Ten
我正在尝试使用 rms 包从 R 中的逻辑回归绘制列线图,但目前我遇到一个问题:确实,我可以获得列线图,但“线性预测器”轴的范围从 -2.5 到 + 3,我想知道是否可以使其范围从 0 到 1(即 Y
使用以下包含二进制 0/1 变量的测试数据帧: test_df = pd.DataFrame([ [0, 0, 0, 1], [1, 0, 1, 1], [0, 0, 0, 1
我已经安装了逻辑回归模型,该模型可以根据vs(mpg数据集)预测二进制结果mtcars。该图如下所示。如何确定任何特定mpg值的vs值?例如,当mpg的概率为0.50时,我有兴趣找出vs的值是多少。感
我的问题:删除带有 NA 的预测变量并考虑排除该预测变量的完整案例的最有效方法是什么? 问题源自以下 NA 的回归情况,其中 Ozone(大部分)和 Solar.R 中缺少值>. data(airqu
所以我有一个训练集,其中一个属性的域如下: A = {Type1, Type2, Type3, ... ,Type5} 如果域保持这种形式,我就无法应用线性回归,因为数学假设不可能成立,例如: H =
概览 我正在按照教程(见下文)从袋装树、随机森林、提升树和一般线性模型中找到最适合的模型。 教程(参见下面的示例) https://bcullen.rbind.io/post/2020-06-02-t
我是一名优秀的程序员,十分优秀!