python - Python statsmodels ARIMA LinAlgError : SVD did not converge-6ren

python - Python statsmodels ARIMA LinAlgError : SVD did not converge

转载作者：行者123 更新时间：2023-12-01 07:50:53

背景:我正在开发一个使用statsmodels的程序，该程序适合27个arima模型(p，d，q = 0,1,2)到100多个变量，并为AR/选择具有最低aic和具有统计意义的t统计量的模型Dickey Fuller检验的MA系数和具有统计意义的p值...

对于一个特定变量和一组特定参数，我得到

LinAlgError: SVD did not converge

对于复制，变量和失败的代码如下

rollrate =[0.3469842191781748,
 0.9550689157572028,
 0.48170862494888256,
 0.15277985674197356,
 0.46102487817508747,
 0.32777706854320243,
 0.5163787896482797,
 0.01707716528127215,
 0.015036662424309755,
 0.2299825242910243,
 0.03719773802216722,
 0.24392098372995807,
 0.1783587055969874,
 0.6759904243574179,
 0.1197617555878022,
 0.04274682226635633,
 0.27369984820298465,
 0.18999355015483932,
 0.2985208240580264,
 0.2872064881442138,
 1.0522764728046277,
 0.3694114556631419,
 0.09613536093441034,
 0.6648215681632191,
 0.3223120091564835,
 0.9274048223872483,
 0.2763221143255601,
 0.4501460109958479,
 0.2220472247972312,
 0.3644512582291407,
 0.7790042237519584,
 0.3749145302678043,
 1.2771681290160286,
 0.6760112486224217,
 0.5214358465170098,
 0.84041997296269,
 0.12054593136059581,
 0.18900376737686622,
 0.042561102427304424,
 0.17189805124670604,
 0.11383752243305952,
 0.2687780002387387,
 0.717538770963329,
 0.26636160206108384,
 0.04221743047344771,
 0.3259506533106764,
 0.20146525340606328,
 0.4059344185647537,
 0.07503287726465639,
 0.3011594076817088,
 0.1433563136989911,
 0.14803562944375281,
 0.23096999679467808,
 0.31133672787599703,
 0.2313639154827471,
 0.30343086620083537,
 0.4608439884577555,
 0.19149827372467804,
 0.2506814947310181,
 1.008458195025946,
 0.3776434264127751,
 0.344728062930179,
 0.2110402015365776,
 0.26582041849423843,
 1.1019000121595244,
 0.0,
 0.023068095385979804,
 0.014256779894199491,
 0.3209225608633755,
 0.00294468492742426,
 0.0,
 0.3346732726544143,
 0.38256681208088283,
 0.4916019617068597,
 0.06922156984602362,
 0.34458053250016984,
 0.0,
 0.09615667784109984,
 1.8271531669931351,
 0,
 0,
 0.0,
 0,
 0.0,
 0.03205594450156685,
 0.0,
 0.0,
 0.0,
 0,
 0.0,
 0,
 0.0,
 0,
 0,
 1.0,
 0]


p=2
q=2
d=0
fit = statsmodels.api.tsa.ARIMA(rollRate, (p,d,q)).fit(transparams=False)

我了解到，特定参数p = 2，d = 2，q = 0可能是该变量的可怕ARIMA模型，并且由于许多零或不稳定的性质，变量本身可能不是ARIMA模型的合适候选者，但我需要一种可能绕过此错误或解决问题的方法，以使程序可以遍历参数。谢谢

最佳答案

也许考虑尝试这种方式，因为这是我从机器学习精通的Jason Brownlee(PhD)中学到的方法的组合
https://machinelearningmastery.com/arima-for-time-series-forecasting-with-python/
和数学家Farhad Malik
https://towardsdatascience.com/forecasting-exchange-rates-using-arima-in-python-f032f313fc56
通过结合他们的方法和技术，我得出了我认为是可行且可靠的模型。
这是我花了很长时间痛苦地拼凑在一起的代码:

import warnings
import pandas as pd
from statsmodels.tsa.arima_model import ARIMA
from sklearn.metrics import mean_squared_error
from math import sqrt
from matplotlib import pyplot

rollRate=[0.3469842191781748,0.9550689157572028,0.48170862494888256,0.15277985674197356,0.46102487817508747,0.32777706854320243,
0.5163787896482797,0.01707716528127215,0.015036662424309755,0.2299825242910243,0.03719773802216722,0.24392098372995807,
0.1783587055969874,0.6759904243574179,0.1197617555878022,
0.04274682226635633,0.27369984820298465,0.18999355015483932,0.2985208240580264,0.2872064881442138,1.0522764728046277,
0.3694114556631419,0.09613536093441034,0.6648215681632191,0.3223120091564835,0.9274048223872483,0.2763221143255601,
0.4501460109958479,0.2220472247972312,0.3644512582291407,0.7790042237519584,0.3749145302678043,
1.2771681290160286,0.6760112486224217,0.5214358465170098,0.84041997296269,0.12054593136059581,
0.18900376737686622,0.042561102427304424,0.17189805124670604,0.11383752243305952,0.2687780002387387,
0.717538770963329,0.26636160206108384,0.04221743047344771,0.3259506533106764,0.20146525340606328,0.4059344185647537,
0.07503287726465639,0.3011594076817088,0.1433563136989911,0.14803562944375281,0.23096999679467808,
0.31133672787599703,0.2313639154827471,0.30343086620083537,0.4608439884577555,0.19149827372467804,
0.2506814947310181,1.008458195025946,0.3776434264127751,0.344728062930179,0.2110402015365776,0.26582041849423843,
1.1019000121595244,0.0,0.023068095385979804,0.014256779894199491,0.3209225608633755,0.00294468492742426,0.0,
0.3346732726544143,0.38256681208088283,0.4916019617068597,0.06922156984602362,0.34458053250016984,0.0,
0.09615667784109984,1.8271531669931351,0,0,0.0,0,0.0,0.03205594450156685,0.0,0.0,0.0,0,0.0,0,0.0,0,0,1.0,0]

# Evaluate an ARIMA model for a given order (p,d,q) and return RMSE
def evaluate_arima_model(X, arima_order):
    # prepare training dataset
    X = X.astype('float32')
    train_size = int(len(X) * 0.50)
    train, test = X[0:train_size], X[train_size:]
    history = [x for x in train]
    # make predictions
    predictions = list()
    for t in range(len(test)):
        model = ARIMA(history, order=arima_order)
        # model_fit = model.fit(disp=0)
        model_fit = model.fit(trend='nc', disp=0)
        yhat = model_fit.forecast()[0]
        predictions.append(yhat)
        history.append(test[t])
    # calculate out of sample error
    rmse = sqrt(mean_squared_error(test, predictions))
    return rmse

# evaluate combinations of p, d and q values for an ARIMA model
def evaluate_models(dataset, p_values, d_values, q_values):
    dataset = dataset.astype('float32')
    best_score, best_cfg = float("inf"), None
    for p in p_values:
        for d in d_values:
            for q in q_values:
                order = (p, d, q)
                try:
                    rmse = evaluate_arima_model(dataset, order)
                    print(rmse)
                    if rmse < best_score:
                        best_score, best_cfg = rmse, order
                    print('ARIMA%s RMSE=%.3f' % (order, rmse))
                except:
                    continue
    print('Best ARIMA%s RMSE=%.3f' % (best_cfg, best_score))

p_values = range(0, 2)
d_values = range(0, 1)
q_values = range(0, 2)
warnings.filterwarnings("ignore")

dataset = pd.Series([356,386,397,397,413,458,485,344,390,360,420,435,439,454,462,454,469,500,492,473,458,469,481,
          488,466,462,473,530,662,651,587,515,526,503,503,503,515,522,492,503,503,450,432,432,458,462,
          503,488,466,492,503,515,500,522,575,583,587,628,640,609,606,632,617,613,598,575,564,549,538,
          568,575,579,587,602,594,587,587,625,613])

dataset = dataset.values
print('\n==============================\n')
evaluate_models(dataset, p_values, d_values, q_values)

pp = 2
dd = 1
qq = 2

def StartProducingARIMAForecastValues(dataVals, p, d, q):
    model = ARIMA(dataVals, order=(p, d, q))
    model_fit = model.fit(disp=0)
    pred = model_fit.forecast()[0]
    return pred

print('\n==============================\n')

predictions = StartProducingARIMAForecastValues(rollRate, 1, 1, 0)
print('First Prediction=%f' % (predictions))

Actual = [x for x in rollRate]
Predictions = list()

for timestamp in range(len(rollRate)):
    ActualValue = rollRate[timestamp]
    Prediction = StartProducingARIMAForecastValues(Actual, 3, 1, 0)
    print('Actual=%f, Predicted=%f' % (ActualValue, Prediction))

    Predictions.append(Prediction)
    Actual.append(ActualValue)

Error = mean_squared_error(rollRate, Predictions)

print('Test Mean Squared Error : %.3f' % Error)
# plot
pyplot.plot(rollRate)
pyplot.plot(Predictions, color='red')
pyplot.show()

和输出图:

和输出本身:

关于python - Python statsmodels ARIMA LinAlgError : SVD did not converge，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27309243/

文章推荐： java - 解析日期时间字符串在索引 21 上给出错误

文章推荐： jquery - 正则表达式查找带有大括号的 data-src 属性

文章推荐： jquery - datediff 不工作 Coldfusion

文章推荐： python - 如何同时绘制不同产品的时间序列图？

使用来自不同数据的 auto.arima 的参数对数据运行 ARIMA 模型
我想获取完整数据模型的参数，然后使用这些参数针对数据的“样本内”运行模型，但我不知道该怎么做。例如; data<-c(79160.56266,91759.73029,91186.47551,1063
R 库 forecast::auto.arima vs fable:ARIMA 有什么区别？
在线文档表明引擎盖下的算法与估计 (s)Arima 模型相同。在一些测试中，使用 Kaggle 数据集，我有不同的模型:ARIMA 函数显示了一个 sArima，auto.arima 只有 Arima
r - 使用 auto.Arima() 和 xreg 进行 ARIMA 预测
我正在从事预测商店销售的项目以学习预测。到目前为止，我已经成功地使用了简单的 auto.Arima() 函数进行预测。但是为了使这些预测更准确，我可以使用协变量。我已经定义了协变量，例如假期，在这篇文
r - 对于不同的 arima 模拟组合，在 r 中获得第一个真实顺序之前，如何计算 arima 顺序不正确的次数
大多数时候运行 arima.sim() 函数来模拟 arima mosel 的特定顺序，但是当通过 auto 检查此类模拟时间序列数据时。 arima() 函数，它通常不会与 arima.sim()
r - auto arima : r and python suggest different arima models for same data, 为什么？
我曾尝试在 python 中同时在 R 上使用 auto arima 获取相同的数据，但得到了不同的 ARIMA 模型选择是具有不同 AIC 的最佳模型。你能告诉我为什么我从两种语言中得到具有不同 A
r - 使用 arima.sim 模拟带有 R 漂移的 ARIMA 1,1,1
我正在尝试使用 ARIMA sim 包来模拟具有漂移的 ARIMA 模拟。我的问题是我似乎无法让它工作。我需要得到这样的东西: enter image description here 我的代码正在
r - ARIMA 常数的标准误差
我正在尝试手动计算 ARIMA 模型中常量的标准误差(如果包含)。我引用了 Box 和 Jenkins (1994) 的文本，特别是第 7.2 节，但我的理解是这里提到的方法仅计算 ARIMA 参数的
r - ARIMA 拟合值
您好，我想知道是否可以仅提取 ARIMA 模型的值？每当我只查找它创建的一组值时，我都无法在它创建的列表中找到它们。我看到残差、系数等，但值在哪里。我知道我可能会误解 ARIMA 在 R 中所做的事情
r - 指定季节性 ARIMA
我有一些 forecast::Arima 语法问题。如果我知道季节性 ARIMA 在统计上是正确的，因为它是 auto.arima 的结果，我如何修复以下 Arima 函数使其具有与 auto.ari
python - ARIMA 超出统计模型中的样本预测？
我有一个时间序列预测问题，我正在使用 statsmodels python 包来解决。使用 AIC 标准进行评估，结果证明最优模型相当复杂，类似于 ARIMA(27,1,8) [我没有对参数空间进行详
python - ARIMA 模型的逆平稳性
如何反转平稳性并将日期重新应用于数据以进行绘图？源代码: https://nbviewer.jupyter.org/github/robbiemu/location-metric-data/blob
Python ARIMA 外生变量样本外
我试图在包含外生变量的 python statsmodels ARIMA 包中预测时间序列，但无法找出在预测步骤中插入外生变量的正确方法。参见 here对于文档。 import numpy as np
python - ARIMA 模型的不可逆
我正在尝试编写代码来生成一系列 arima 模型并比较不同的模型。代码如下。 p=0 q=0 d=0 pdq=[] aic=[] for p in range(6): for d in ran
r - 寓言包 ARIMA 算法是否能够并行工作？
我正在尝试使用 fable 包为 1000 家商店创建预测。 fable 包是否像 forecast 函数一样并行工作？非常感谢最佳答案您可以使用来自 future 包的 plan() 并行模型
python - 趋势的 ARIMA 顺序
我正在尝试拟合 ARIMA 模型。我有 3 个月的数据，它每分钟显示 count(float)。我应该为 arima.fit() 传递哪个顺序？我需要预测每一分钟。最佳答案基本的 ARIMA(p,
r - 使用额外回归量预测 ARIMA 模型
假设我有一些如下的时间序列，我想预测 c1一步一个头，在 R 中这样做非常简单和容易: testurl = "https://docs.google.com/spreadsheets/d/1jtpQa
r - 使用 Arima 模型预测不在序列结束之前的时期的值
我正在生成带有外部回归器的 Arima 模型。假设我有观察。 predict.Arima函数来自 forecast包只是对进行预测n + 1 观察。我需要对进行预测值(系列的最后一个值)，改变
R:使用现有数据的参数生成季节性 ARIMA 时间序列模型
我有一个计数时间序列数据，我可以用它来确定基础随机过程的参数。例如说我有一个 SARIMA (p,d,q)(P,D,Q)[S] 季节性 ARIMA 模型。如何使用它来生成新的计数时间序列数据集？更
Python Auto ARIMA 模型无法正常工作
我创建了一个带有有效 DatetimeIndex 的 Pandas DataFrame df.index = df.timestamp df = df.resample("10Min", how="m
r - 模拟季节性 ARIMA 模型的问题
我正在尝试通过以下命令使用 R 中的预测包从季节性 arima 模型生成模拟: simulate(model_temp) 哪里model_temp是应用 arima() 的结果函数到我观察到的时间序列

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - Python statsmodels ARIMA LinAlgError : SVD did not converge