Python ARIMA 外生变量样本外-6ren

Python ARIMA 外生变量样本外

转载作者：太空狗更新时间：2023-10-29 20:27:28

25

4

我试图在包含外生变量的 python statsmodels ARIMA 包中预测时间序列，但无法找出在预测步骤中插入外生变量的正确方法。参见 here对于文档。

import numpy as np
from scipy import stats
import pandas as pd

import statsmodels.api as sm

vals = np.random.rand(13)
ts = pd.TimeSeries(vals)
df = pd.DataFrame(ts, columns=["test"])
df.index = pd.Index(pd.date_range("2011/01/01", periods = len(vals), freq = 'Q'))

fit1 = sm.tsa.ARIMA(df, (1,0,0)).fit()
#this works fine:
pred1 = fit1.predict(start=12, end = 16)
print(pred1)

Out[32]: 
2014-03-31    0.589121
2014-06-30    0.747575
2014-09-30    0.631322
2014-12-31    0.654858
2015-03-31    0.650093
Freq: Q-DEC, dtype: float64

现在加入一个趋势外生变量

exogx = np.array(range(1,14))
#to make this easy, let's look at the ols of the trend (arima(0,0,0))
fit2 = sm.tsa.ARIMA(df, (0,0,0),exog = exogx).fit()
print(fit2.params)

const    0.555226
x1       0.013132
dtype: float64

print(fit2.fittedvalues)

2011-03-31    0.568358
2011-06-30    0.581490
2011-09-30    0.594622
2011-12-31    0.607754
2012-03-31    0.620886
2012-06-30    0.634018
2012-09-30    0.647150
2012-12-31    0.660282
2013-03-31    0.673414
2013-06-30    0.686546
2013-09-30    0.699678
2013-12-31    0.712810
2014-03-31    0.725942
Freq: Q-DEC, dtype: float64

请注意，正如我们所料，这是一条趋势线，随着时间的每一次增加，增加 0.013132(当然，这是随机数据，所以如果你运行它，值会不同，但是正趋势或负趋势故事将相同)。因此，下一个值(时间 = 14)应该是 0.555226 + 0.013132*14 = 0.739074。

#out of sample exog should be (14,15,16)
pred2 = fit2.predict(start = 12, end = 16, exog = np.array(range(13,17)))
print(pred2)
2014-03-31    0.725942
2014-06-30    0.568358
2014-09-30    0.581490
2014-12-31    0.594622
2015-03-31    0.765338
Freq: Q-DEC, dtype: float64

因此，2014-03-31 预测(最后一个样本)正确，但 2014-06-30 从头开始(t = 1)，但请注意 2015-03-31(实际上，总是最后一次观察预测，无论时间范围如何)在 t = 16 时开始(即，(值 - 截距)/beta = (0.765338 - 0.555226)/0.013132)。

为了更清楚地说明这一点，请注意当我膨胀 x 垫的值时会发生什么

fit2.predict(start = 12, end = 16, exog = np.array(range(13,17))*10000)
Out[41]: 
2014-03-31       0.725942
2014-06-30       0.568358
2014-09-30       0.581490
2014-12-31       0.594622
2015-03-31    2101.680532
Freq: Q-DEC, dtype: float64

看到 2015-03-31 爆炸了，但没有考虑其他 xmat 值？我在这里做错了什么？？？

我已经尝试过各种我知道如何传递 exog 变量的方法(改变维度，使 exog 成为矩阵，使 exog 与输入加上地平线一样长，等等)。任何建议将不胜感激。

我使用的是 Anaconda2.1 的 2.7 NumPy 1.8.1科学 0.14.0 Pandas 0.14.0统计模型 0.5.0

并已在 windows 7 64 位和 centos 64 位上验证了该问题。

还有一些事情。我将 ARIMA 用于 ARIMA 功能，以上内容仅用于说明(也就是说，我不能像我想象的那样“只使用 OLS...”)。由于项目的限制(更普遍的是，基础 Spark 中缺乏对 R 的支持)，我也不能“只使用 R”。

下面是代码中有趣的部分，以防您想自己尝试

import numpy as np
from scipy import stats
import pandas as pd
import statsmodels.api as sm

vals = np.random.rand(13)
ts = pd.TimeSeries(vals)
df = pd.DataFrame(ts, columns=["test"])
df.index = pd.Index(pd.date_range("2011/01/01", periods = len(vals), freq = 'Q'))

exogx = np.array(range(1,14))
fit2 = sm.tsa.ARIMA(df, (0,0,0),exog = exogx).fit()
print(fit2.fittedvalues)
pred2 = fit2.predict(start = 12, end = 16, exog = np.array(range(13,17))*10000)
print(pred2)

最佳答案

这可能更好地发布在 github issue tracker 上.我提交了 ticket虽然。

最好在那里提交工单，否则我可能会忘记。这几天很忙。

对于 k_ar == 0 的特殊情况，逻辑中存在错误。应该修复。让我知道您是否可以/不能试用该补丁。如果没有，我可以做一些更严格的测试并合并它。

Spark 之上的 Statsmodels？我很好奇。

关于Python ARIMA 外生变量样本外，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25044165/

25

4

0

文章推荐： python - 将文档内链接添加到 PDF

文章推荐： python - 将 numpy.digitize 扩展到多维数据

文章推荐： c# - MSBUILD .NET v4 团队城市

文章推荐： python - 我如何测试织物任务

javascript if( 变量 = =(变量 2 || 变量 3 || ...))
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: How to nest OR statements in JavaScript? 有没有办法做到这一点:
JavaScript 变量 = 变量
在 JavaScript 中有没有办法让一个变量总是等于一个变量？喜欢var1 = var2但是当var2更新，也是var1 . 例子 var var1 = document.getElementBy
python - 如何阅读此 python 代码？变量 1 = 变量 2 == 变量 3
我正在努力理解这代表什么 var1 = var2 == var3 我的猜测是这等同于: if (var2 == var3): var1 = var2 最佳答案赋值 var1 = var2
php - 变量 $_GET 变量
这个问题已经有答案了: What does the PHP error message "Notice: Use of undefined constant" mean? (2 个回答) 已关闭 8
MySQL:变量=变量+select语句
我在临时表中有几条记录，我想从每条记录中获取一个值并将其添加到一个变量中，例如 color | caption -------------------------------- re
linux - 如何将原始字符串转换为变量(变量 --> $变量)？
如何将字符串转为变量(字符串变量--> $variable)？或者用逗号分隔的变量列表然后转换为实际变量。我有 2 个文件: 列名文件行文件我需要根据字符串匹配行文件中的整行，并根据列名文件命
PHP:来自与变量(变量-变量)连接的字符串的新变量
我有一个我无法解决的基本 php 问题，我也想了解为什么! $upperValueCB = 10; $passNodeMatrixSource = 'CB'; $topValue= '$uppe
php 变量 = 变量 1 ||变量2
这可能吗？ php $variable = $variable1 || $variable2? 如果 $variable1 为空则使用 $variable2 是否存在类似的东西？最佳答案 PHP 5
perl - for 循环不会修改 `my` 变量，但会修改 `our` 变量
在 Perl 5.20 中，for 循环似乎能够修改模块作用域的变量，但不能修改父作用域中的词法变量。 #!/usr/bin/env perl use strict; use warnings; ou
JavaScript: 变量 = 变量.concat(另一个变量);
为什么这不起作用: var variable; variable = variable.concat(variable2); $('#lunk').append(variable) 我无法弄清楚这一点
c++ - 指针的大小(*变量 VS 变量)
根据我的理解，在32位机器上，指针的sizeof是32位(4字节)，而在64位机器上，它是8字节。无论它们指向什么数据类型，它们都有固定的大小。我的计算机在 64 位上运行，但是当我打印包含 * 的大
java - 变量+=值和变量=变量+值之间的区别；
例如: int a = 10; a += 1.5; 这运行得很完美，但是 a = a+1.5; 此作业表示类型不匹配:无法从 double 转换为 int。所以我的问题是:+= 运算符和= 运算符
MySQL 语法错误 |变量 = 变量 + 整数
您好，我写了这个 MySQL 存储过程，但我一直收到这个语法错误 #1064 - You have an error in your SQL syntax; check the manual that
swift - 如果(变量 == 变量 + 5)
我试图在我的场景中显示特定的奖牌，这取决于你的高分是基于关卡的目标。 // Get Medal Colour if levelHighscore goalScore { sc
c++ - 变量 = !!变量与变量 =(变量!= 0)
我必须维护相当古老的 Visual C++ 源代码的大型代码库。我发现代码如下: bIsOk = !!m_ptr->isOpen(some Parameters) bIsOk的数据类型是bool，is
php - Javascript 变量，发送到 PHP 变量
我有一个从 MySQL 数据库中提取的动态产品列表。在 list 上有一个立即联系按钮，我正在使用一个 jquery Modal 脚本，它会弹出一个表单。我的问题是尝试将产品信息变量传递给该弹出窗
c++ - 类型(变量)与(类型)变量
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: What is the difference between (type)value and type(va
javascript - 变量 === 未定义与 typeof 变量 === "undefined"
jQuery Core Style Guidelines建议两种不同的方法来检查变量是否已定义。全局变量:typeof variable === "undefined" 局部变量:variable
jquery - 动态(变量)变量(如 php 中的？)
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: “Variable” Variables in Javascript? 我想肯定有一种方法可以在 JavaScrip
c# - 变量 1 = 变量 2 = 真；优点缺点？
在语句中使用多重赋值有什么优点或缺点吗？在简单的例子中 var1 = var2 = true; 赋值是从右到左的(我相信 C# 中的所有赋值都是如此，而且可能是 Java，尽管我没有检查后者)。但是，

首页

博学

6Ren·AI

商城

Python ARIMA 外生变量样本外