gpt4 book ai didi

statistics - 在时间序列数据集上使用循环神经网络进行预测

转载 作者:行者123 更新时间:2023-12-03 22:21:28 25 4
gpt4 key购买 nike

说明

给定一个具有 10 个序列的数据集——一个序列对应于一天的股票值(value)记录——其中每个序列包含 50 个股票值(value)的样本记录,从早上或上午 9:05 开始,以 5 分钟的间隔分开。但是,有一个额外的记录(第 51 个样本)仅在训练集中可用,它比 50 个样本记录中的最后一个记录样本晚 2 小时,而不是 5 分钟。需要为测试集预测第 51 个样本,其中还给出了前 50 个样本。

我正在使用 pybrain这个问题的循环神经网络将序列组合在一起,以及每个样本的标签(或通常称为目标 y)x_i是下一个时间步的样本x_(i+1) - 时间序列预测中的典型公式。

示例

A sequence for one day is something like:

Signal id Time value
1 - 9:05 - 23
2 - 9:10 - 31
3 - 9:15 - 24
... - ... - ...
50 - 13:15 - 15

Below is the 2 hour later label 'target' given for the training set
and is required to be predicted for the testing set
51 - 15:15 - 11

问题

现在我的循环神经网络 (RNN) 已经对这 10 个序列进行了训练,如果它遇到另一个序列,我将如何使用 RNN预测股票值(value) 2 hours在序列中的最后一个样本之后?

请注意,对于每个训练序列,我还有“比最后一个样本库存值晚 2 小时”,但我不确定如何将其纳入训练 RNN因为它期望样本之间的时间间隔相同。谢谢!

最佳答案

我希望这会帮助你

循环网络结构

enter image description here

一些提示

选择你的循环网络

更成熟的长短时内存 (LSTM) 神经网络非常适合此类任务。 LSTM 能够检测股票值(value)“图表”中常见的“形状”和“变化”,并且有很多研究试图证明这种形状在现实生活中确实存在! See this link for an example .

准确度

如果您希望网络达到更高的准确度,我建议您还向网络提供上一年(完全相同的日期)的股票值(value),以便输入数量从 50 翻倍到 100。尽管网络可能会在你的数据集上得到很好的优化,它永远无法预测 future 不可预测的行为;)

关于statistics - 在时间序列数据集上使用循环神经网络进行预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18670558/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com