gpt4 book ai didi

machine-learning - 使用循环神经网络解决时间序列任务

转载 作者:行者123 更新时间:2023-11-30 09:49:19 24 4
gpt4 key购买 nike

我有下一个问题要解决:预测第二天/一周的“工作需求”。我有去年的 sample (377 个 sample ,每天 1 个)。我的变量与信息相关(或者至少我认为是相关的):日、周、月、假日、天气条件(温度、雨、雪)、订阅量(13 个变量)我把从一开始到今天所有 sample 的需求都画出来了,得到:

enter image description here

如果我将这个需求分到一周内(周一、周二……),我会得到: enter image description here

enter image description here

enter image description here

enter image description here

enter image description here

enter image description here

enter image description here

我认为这是一个“时间序列”问题,所以我尝试用神经网络,特别是循环神经网络来解决它。我的问题如下:

1)这真的是一个“时间序列”问题吗?

2)用神经网络解决这个问题好不好?哪种类型? RNN?

3)如果 RNN 是最好的,我是否应该考虑另一个可能常见但我没有考虑的变量?

4)如果神经网络不是最好的方法,那么哪一种是最好的方法?

5) 我应该尝试训练 7 个不同的网络(一周每天一个)还是应该尝试训练 1 个“大”网络?

6) 可以保留异常值还是应该删除它? (outleirs发生在节假日)

最佳答案

1) Is it really a "Time series" problem?

作者:definition ,时间序列是按时间顺序索引的一系列数据点。你的问题完全符合。所以,是的,这是一个时间序列问题。

2) Is it a good problem to be solved with NN? Which type? RNN?

RNN 无疑是这个问题的候选者:RNN 擅长捕获系列数据中的相似模式,例如从语料库中的大量句子中学习语言规则。您的第一个图表清楚地表明连续时间步长的点之间存在依赖性。

3) If RNN is the best, should I consider another variable that maybe is common and I am not taking it into account?

这个问题没有通用的答案。深度网络可以从输入特征中学习新特征(称为 feature extraction ),但也可能无法做到这一点,您必须准备它们。

4) If neural networks is not the best approach, which one is?

再一次,这个问题太宽泛了。不存在单一的最佳方法。这就是为什么我在这里谨慎表述:RNN 是一个很好的候选者,换句话说,我认为立即尝试它不会有任何问题。

有一些关于时间序列分析的书籍,统计工具包括自回归、自相关、季节性等。讨论这些完全超出了 StackOverflow 的范围。如果您有兴趣,我建议您询问 CrossValidated .

5) Should I try to train 7 different networks (one per day of the week) or should I try to train 1 "big" network?

如果不同日期之间的分布存在明显的差异,您就可以这样做。坦率地说,我在上面的图表中没有注意到这一点,但需要调查原始数据才能回答这个问题。

6) Is it okay to keep the outliers or should I remove it? (outleirs occurs on holidays)

一般来说,神经网络不擅长预测异常值,因为这里没有模式。但是您的第一个图表没有显示明显的异常值,因此使用它而不是使用每周图表是一个争论。

关于machine-learning - 使用循环神经网络解决时间序列任务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47949161/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com