- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我目前正在尝试使用 statsmodels ARIMA 库实现直接和递归多步预测策略,它提出了一些问题。
递归多步预测策略将训练一个单步模型,预测下一个值,将预测值附加到我输入预测方法的外生值的末尾并重复。这是我的递归实现:
def arima_forecast_recursive(history, horizon=1, config=None):
# make list so can add / remove elements
history = history.tolist()
model = ARIMA(history, order=config)
model_fit = model.fit(trend='nc', disp=0)
for i, x in enumerate(history):
yhat = model_fit.forecast(steps=1, exog=history[i:])
yhat.append(history)
return np.array(yhat)
def walk_forward_validation(dataframe, config=None):
n_train = 52 # Give a minimum of 2 forecasting periods to capture any seasonality
n_test = 26 # Test set should be the size of one forecasting horizon
n_records = len(dataframe)
tuple_list = []
for index, i in enumerate(range(n_train, n_records)):
# create the train-test split
train, test = dataframe[0:i], dataframe[i:i + n_test]
# Test set is less than forecasting horizon so stop here.
if len(test) < n_test:
break
yhat = arima_forecast_recursive(train, n_test, config)
results = smape3(test, yhat)
tuple_list.append(results)
return tuple_list
与执行直接策略类似,我只需将我的模型拟合到可用的训练数据上,然后使用它来一次预测总的多步预测。我不确定如何使用 statsmodels 库实现此目的。
我的尝试(产生结果)如下:
def walk_forward_validation(dataframe, config=None):
# This currently implements a direct forecasting strategy
n_train = 52 # Give a minimum of 2 forecasting periods to capture any seasonality
n_test = 26 # Test set should be the size of one forecasting horizon
n_records = len(dataframe)
tuple_list = []
for index, i in enumerate(range(n_train, n_records)):
# create the train-test split
train, test = dataframe[0:i], dataframe[i:i + n_test]
# Test set is less than forecasting horizon so stop here.
if len(test) < n_test:
break
yhat = arima_forecast_direct(train, n_test, config)
results = smape3(test, yhat)
tuple_list.append(results)
return tuple_list
def arima_forecast_direct(history, horizon=1, config=None):
model = ARIMA(history, order=config)
model_fit = model.fit(trend='nc', disp=0)
return model_fit.forecast(steps=horizon)[0]
让我特别困惑的是,模型是否应该只对所有预测进行一次拟合,或者多次拟合以在多步预测中进行单个预测?取自Souhaib Ben Taieb's doctoral thesis (page 35 paragraph 3)据介绍,直接模型将估计 H 个模型,其中 H 是预测范围的长度,因此在我的示例中,预测范围为 26,应该估计 26 个模型而不是一个模型。如上所示,我当前的实现仅适用于一种模型。
我不明白的是,如果我对相同的训练数据多次调用 ARIMA.fit() 方法,我将得到一个模型,我将得到一个与预期的正常随机变化之外的任何不同的拟合?
我的最后一个问题是关于优化的。使用前向验证之类的方法在统计上可以得到非常显着的结果,但对于许多时间序列来说,它的计算成本非常高。上面的两个实现都已使用 joblib 并行循环执行功能调用,这显着减少了我笔记本电脑上的运行时间。但是我想知道是否可以对上述实现做任何事情来使它们更有效率。当对约 2000 个独立的时间序列(所有系列总共约 500,000 个数据点)运行这些方法时,运行时间为 10 小时。我分析了代码,大部分执行时间花在了 statsmodels 库中,这很好,但是 walk_forward_validation() 方法和 ARIMA.fit() 的运行时间之间存在差异。这是预期的,因为 walk_forward_validation() 方法显然不只是调用 fit 方法,但如果可以更改其中的任何内容以加快执行时间,请告诉我。
这段代码的想法是为每个时间序列找到一个最优的 arima 顺序,因为单独研究 2000 个时间序列是不可行的,因此每个时间序列调用 walk_forward_validation() 方法 27 次。所以总体上大约是 27,000 次。因此,任何可以在此方法中找到的性能节省都会产生影响,无论它有多小。
最佳答案
通常情况下,ARIMA 只能进行递归预测,不能进行直接预测。可能对用于直接预测的 ARIMA 变体进行了一些研究,但它们不会在 Statsmodels 中实现。在 statsmodels 中(或在 R auto.arima() 中),当您为 h > 1 设置一个值时,它只是执行递归预测以到达那里。
据我所知,目前还没有一个标准预测库实现了直接预测,您将不得不自己编写代码。
Taken from Souhaib Ben Taieb's doctoral thesis (page 35 paragraph 3) it is presented that direct model will estimate H models, where H is the length of the forecast horizon, so in my example with a forecast horizon of 26, 26 models should be estimated instead of just one.
我没读过Ben Taieb的论文,但是来自his paper "Machine Learning Strategies for Time Series Forecasting" ,对于直接预测,对于一个 H 值只有一个模型。因此对于 H=26,将只有一个模型。如果你需要对 1 到 H 之间的每个值进行预测,就会有 H 个模型,但是对于一个 H,只有一个模型。
关于python - Statsmodels:使用 ARIMA 实现直接和递归的多步预测策略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53064545/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!