gpt4 book ai didi

python - 如何检测时间序列数据(特别是)中存在趋势和季节性的异常?

转载 作者:行者123 更新时间:2023-12-03 19:26:35 25 4
gpt4 key购买 nike

我想检测包含趋势和季节性成分的“时间序列数据”中的异常值。我想忽略季节性的峰值,只考虑其他峰值并将它们标记为异常值。由于我是时间序列分析的新手,请帮助我解决这个时间序列问题。

使用的编码平台是 Python。

尝试 1:使用 ARIMA 模型

我已经训练了我的模型并预测了测试数据。然后能够计算预测结果与我的测试数据的实际值之间的差异,然后能够根据观察到的方差找出异常值。

Auto Arima的实现

!pip install pyramid-arima
from pyramid.arima import auto_arima
stepwise_model = auto_arima(train_log, start_p=1, start_q=1,max_p=3, max_q=3,m=7,start_P=0, seasonal=True,d=1, D=1, trace=True,error_action='ignore', suppress_warnings=True,stepwise=True)
import math
import statsmodels.api as sm
import statsmodels.tsa.api as smt
from sklearn.metrics import mean_squared_error

将数据拆分为训练集和测试集
train, test = actual_vals[0:-70], actual_vals[-70:]

日志转换
train_log, test_log = np.log10(train), np.log10(test)

转换为列表
history = [x for x in train_log]
predictions = list()
predict_log=list()

拟合逐步 ARIMA 模型
for t in range(len(test_log)):
stepwise_model.fit(history)
output = stepwise_model.predict(n_periods=1)
predict_log.append(output[0])
yhat = 10**output[0]
predictions.append(yhat)
obs = test_log[t]
history.append(obs)

绘图
figsize=(12, 7)
plt.figure(figsize=figsize)
pyplot.plot(test,label='Actuals')
pyplot.plot(predictions, color='red',label='Predicted')
pyplot.legend(loc='upper right')
pyplot.show()

但我只能在测试数据中检测异常值。实际上,我必须检测整个时间序列数据的异常值,包括我拥有的火车数据。

尝试 2:使用季节性分解

我使用以下代码将原始数据拆分为季节性、趋势、残差,如下图所示。
from statsmodels.tsa.seasonal import seasonal_decompose

decomposed = seasonal_decompose()

enter image description here

然后我使用残差数据使用箱线图找出异常值,因为季节性和趋势分量被删除。这有意义吗?

或者有没有其他简单或更好的方法可以使用?

最佳答案

你可以:

  • 在第四张图(残差图)中 "Attempt 2 : Using Seasonal Decomposition"尝试检查极值点,这可能会导致您在季节性序列中出现一些异常。
  • 监督(如果你有一些标记数据):做一些分类。
  • 无监督:尝试预测下一个值并创建一个置信区间来检查预测是否位于其中。
  • 您可以尝试计算数据的相对极值。使用 argrelextrema 如下所示,例如:
  • from scipy.signal import argrelextrema
    x = np.array([2, 1, 2, 3, 2, 0, 1, 0])
    argrelextrema(x, np.greater)

    输出:

    (array([3, 6]),)



    一些随机数据(我对上述 argrelextrema 的实现):
    enter image description here

    关于python - 如何检测时间序列数据(特别是)中存在趋势和季节性的异常?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57069892/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com