python - 多元时间序列的 Keras 递归神经网络-6ren

python - 多元时间序列的 Keras 递归神经网络

转载作者：太空宇宙更新时间：2023-11-04 00:12:38

25

4

我一直在阅读有关 Keras RNN 模型(LSTM 和 GRU)的文章，作者似乎主要关注使用由先前时间步长组成的训练实例的语言数据或单变量时间序列。我的数据有点不同。

我有 10 年每年测量 100,000 人的 20 个变量作为输入数据，第 11 年测量的 20 个变量作为输出数据。我想做的是预测第 11 年的其中一个变量(而不是其他 19 个)的值。

我的数据结构为 X.shape = [persons, years, variables] = [100000, 10, 20] 和 Y.shape = [persons, variable] = [ 100000, 1]。下面是我的 LSTM 模型的 Python 代码。

## LSTM model.

# Define model.

network_lstm = models.Sequential()
network_lstm.add(layers.LSTM(128, activation = 'tanh', 
     input_shape = (X.shape[1], X.shape[2])))
network_lstm.add(layers.Dense(1, activation = None))

# Compile model.

network_lstm.compile(optimizer = 'adam', loss = 'mean_squared_error')

# Fit model.

history_lstm = network_lstm.fit(X, Y, epochs = 25, batch_size = 128)

请问我有四个(相关)问题:

我是否为我拥有的数据结构正确编码了 Keras 模型？我从全连接网络(使用扁平化数据)和 LSTM、GRU 和 1D CNN 模型获得的性能几乎相同，我不知道我是否在 Keras 中犯了错误，或者循环模型是否只是在这种情况下没有帮助。
我是否应该将 Y 作为一个形状为 Y.shape = [persons, years] = [100000, 11] 的系列，而不是将变量包含在 X 中，这将有shape X.shape = [persons, years, variables] = [100000, 10, 19]?如果是这样，如何让 RNN 输出预测序列？当我使用 return_sequences = True 时，Keras 返回错误。
这是使用我拥有的数据进行预测的最佳方式吗？ Keras RNN 模型甚至其他模型是否有更好的选项可供选择？
我如何模拟类似于我拥有的数据结构的数据，以便 RNN 模型的性能优于全连接网络？

更新:

我尝试了一个模拟，我希望这是一个非常简单的案例，其中 RNN 应该优于 FNN。

虽然 LSTM 在隐藏层较少 (4) 时往往优于 FNN，但在隐藏层较多 (8+) 时性能变得相同。谁能想到一个更好的模拟，其中 RNN 有望优于具有类似数据结构的 FNN？

from keras import models
from keras import layers

from keras.layers import Dense, LSTM

import numpy as np
import matplotlib.pyplot as plt

下面的代码模拟了 10,000 个实例、10 个时间步长和 2 个变量的数据。如果第二个变量在第一个时间步中为 0，则 Y 为第一个变量在最后一个时间步中的值乘以 3。如果第二个变量在第一个时间步中为 1，则 Y 为最后一个时间步的第一个变量的值乘以 9。

我希望 RNN 会在内存的第一个时间步中保留第二个变量的值，并使用它来知道哪个值(3 或 9)与最后一个时间步中的第一个变量相乘。

## Simulate data.

instances = 10000

sequences = 10

X = np.zeros((instances, sequences * 2))

X[:int(instances / 2), 1] = 1

for i in range(instances):

    for j in range(0, sequences * 2, 2):

        X[i, j] = np.random.random()

Y = np.zeros((instances, 1))

for i in range(len(Y)):

    if X[i, 1] == 0:

        Y[i] = X[i, -2] * 3

    if X[i, 1] == 1:

        Y[i] = X[i, -2] * 9

下面是 FNN 的代码:

## Densely connected model.

# Define model.

network_dense = models.Sequential()
network_dense.add(layers.Dense(4, activation = 'relu', 
     input_shape = (X.shape[1],)))
network_dense.add(Dense(1, activation = None))

# Compile model.

network_dense.compile(optimizer = 'rmsprop', loss = 'mean_absolute_error')

# Fit model.

history_dense = network_dense.fit(X, Y, epochs = 100, batch_size = 256, verbose = False)

plt.scatter(Y[X[:, 1] == 0, :], network_dense.predict(X[X[:, 1] == 0, :]), alpha = 0.1)
plt.plot([0, 3], [0, 3], color = 'black', linewidth = 2)
plt.title('FNN, Second Variable has a 0 in the Very First Time Step')
plt.xlabel('Actual')
plt.ylabel('Predicted')

plt.show()

plt.scatter(Y[X[:, 1] == 1, :], network_dense.predict(X[X[:, 1] == 1, :]), alpha = 0.1)
plt.plot([0, 9], [0, 9], color = 'black', linewidth = 2)
plt.title('FNN, Second Variable has a 1 in the Very First Time Step')
plt.xlabel('Actual')
plt.ylabel('Predicted')

plt.show()

下面是 LSTM 的代码:

## Structure X data for LSTM.

X_lstm = X.reshape(X.shape[0], X.shape[1] // 2, 2)

X_lstm.shape

## LSTM model.

# Define model.

network_lstm = models.Sequential()
network_lstm.add(layers.LSTM(4, activation = 'relu', 
     input_shape = (X_lstm.shape[1], 2)))
network_lstm.add(layers.Dense(1, activation = None))

# Compile model.

network_lstm.compile(optimizer = 'rmsprop', loss = 'mean_squared_error')

# Fit model.

history_lstm = network_lstm.fit(X_lstm, Y, epochs = 100, batch_size = 256, verbose = False)

plt.scatter(Y[X[:, 1] == 0, :], network_lstm.predict(X_lstm[X[:, 1] == 0, :]), alpha = 0.1)
plt.plot([0, 3], [0, 3], color = 'black', linewidth = 2)
plt.title('LSTM, FNN, Second Variable has a 0 in the Very First Time Step')
plt.xlabel('Actual')
plt.ylabel('Predicted')

plt.show()

plt.scatter(Y[X[:, 1] == 1, :], network_lstm.predict(X_lstm[X[:, 1] == 1, :]), alpha = 0.1)
plt.plot([0, 9], [0, 9], color = 'black', linewidth = 2)
plt.title('LSTM, FNN, Second Variable has a 1 in the Very First Time Step')
plt.xlabel('Actual')
plt.ylabel('Predicted')

plt.show()

最佳答案

是的，使用的代码对于您要执行的操作是正确的。 10 年是用于预测下一年的时间窗口，因此它应该是 20 个变量中每个变量的模型输入数。 100,000 个观测值的样本量与模型的输入形状无关。
您最初塑造因变量 Y 的方式是正确的。您为 1 个变量预测 1 年的窗口，并且您有 100,000 个观测值。关键字参数 return_sequences=True 将导致抛出错误，因为您只有一个 LSTM 层。如果您要实现多个 LSTM 层并且相关层后跟另一个 LSTM 层，请将此参数设置为 True。

我希望我能为 3 提供一些指导，但如果没有你的数据集，我不知道是否可以肯定地回答这个问题。

我要说的是，LSTM 旨在解决常规 RNN 中存在的所谓长期依赖性问题。这个问题归结为随着相关信息被观察到信息有用的时间点之间的差距越来越大，标准 RNN 将更难学习它们之间的关系。考虑根据 3 天的事件与全年的事件来预测股票价格。

这导致了第 4 点。如果我宽松地使用术语“相似”并将您的时间窗口进一步延伸到 50 年而不是 10 年，那么使用 LSTM 获得的优势将变得更加明显。虽然我确信更有经验的人能够提供更好的答案，但我期待看到它。

我发现此页面有助于理解 LSTM:

https://colah.github.io/posts/2015-08-Understanding-LSTMs/

关于python - 多元时间序列的 Keras 递归神经网络，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51975951/

25

4

0

文章推荐： Firefox 中按钮的 CSS 行高样式(减少)

文章推荐： node.js - 机器人无法识别 LUIS 意图

文章推荐： c - 混合开关和 while 在 C 中

文章推荐： javascript - 如何使用媒体查询显示/隐藏元素？

JavaScript 递归
在本教程中，您将借助示例了解 JavaScript 中的递归。递归是一个调用自身的过程。调用自身的函数称为递归函数。递归函数的语法是： function recurse() {
'new'方法中的C#递归
我的类(class) MyClass 中有这段代码: public new MyClass this[int index] { get {
PHP通过FTP下载整个文件夹(递归)
我目前有一个非常大的网站，大小约为 5GB，包含 60,000 个文件。当前主机在帮助我将站点转移到新主机方面并没有做太多事情，我想的是在我的新主机上制作一个简单的脚本以 FTP 到旧主机并下载整个
Java - 递归
以下是我对 AP 计算机科学问题的改编。书上说应该打印00100123我认为它应该打印 0010012但下面的代码实际上打印了 3132123 这是怎么回事？而且它似乎没有任何停止条件？! publi
Kotlin 递归
fun fact(x: Int): Int{ tailrec fun factTail(y: Int, z: Int): Int{ if (y == 0) return z
在C中创建和显示线性链表(递归)
我正在尝试用c语言递归地创建线性链表，但继续坚持下去，代码无法正常工作，并出现错误“链接器工具错误 LNK2019”。可悲的是我不明白发生了什么事。这是我的代码。感谢您提前提供的大力帮助。 #inc
JavaScript 递归？
我正在练习递归。从概念上讲，我理解这应该如何工作(见下文)，但我的代码不起作用。请告诉我我做错了什么。并请解释您的代码的每个步骤及其工作原理。清晰的解释比只给我有效的代码要好十倍。 /* b
Javascript 递归
我有一个 ajax 调用，我想在完成解析并将结果动画化到页面中后调用它。这就是我陷入困境的地方。我能记忆起这个功能，但它似乎没有考虑到动画的延迟。即控制台不断以疯狂的速度输出值。我认为 setIn
JavaScript 递归
有人愿意用通俗易懂的语言逐步解释这个程序(取自书籍教程)以帮助我理解递归吗？ var reverseArray = function(x,indx,str) { return indx == 0 ?
JavaScript 递归
目标是找出数组中整数的任意组合是否等于数组中的最大整数。 function ArrayAdditionI(arr) { arr.sort(function(a,b){ return a -
MySQL用序列化数据连接两个表，递归？
我在尝试获取 SQL 查询所需的所有数据时遇到一些重大问题。我对查询还很陌生，所以我会尽力尽可能地描述这一点。我正在尝试使用 Wordpress 插件 NextGen Gallery 进行交叉查询。
Python:递归
虽然网上有很多关于递归的信息，但我还没有找到任何可以应用于我的问题的信息。我对编程还是很陌生，所以如果我的问题很微不足道，请原谅。感谢您的帮助:) 这就是我想要的结果: listVariations
C练习任务(递归)
我一整天都在为以下问题而苦苦挣扎。我一开始就有问题。我不知道如何使用递归来解决这个特定问题。我将非常感谢您的帮助，因为我的期末考试还有几天。干杯假设有一个包含“n”个元素的整数数组“a”。编写递归函
Javascript 递归
我有这个问题我想创建一个递归函数来计算所有可能的数字 (k>0)，加上数字 1 或 2。数字 2 的示例我有两个可能性。 2 = 1+1 和 2 = 2 ，对于数字 3 两个 poss。 3 = 1+
以Top-Down思维去解决问题——递归
目录递归的基础递归的底层实现（不是重点）递归的应用场景编程中两种解决问题的思维自下而上（Bottom-Up）自上而下（Top-
Python数据结构与算法（4.1）——递归
0. 学习目标递归函数是直接调用自己或通过一系列语句间接调用自己的函数。递归在程序设计有着举足轻重的作用，在很多情况下，借助递归可以优雅的解决问题。本节主要介绍递归的基本概念以及如何构建递归程序。
php - 数组中所有可能的组合 - 递归？
我有一个问题一直困扰着我，希望有人能提供帮助。我认为它可能必须通过递归和/或排列来解决，但我不是一个足够好的 (PHP) 程序员。 $map[] = array("0", "1", "2", "3")
用 dplyr 递归
我有数据 library(dplyr, warn.conflicts = FALSE) mtcars %>% as_tibble() %>% select(mpg, qsec) %>% h
kdb - q - 递归/
在 q 中，over 的常见插图运算符(operator) /是 implementation of fibonacci sequence 10 {x,sum -2#x}/ 1 1 这确实打印了前 1
methods - 递归 - 一个语句中的两个调用
我试图理解以下代码片段中的递归调用。 static long fib(int n) { return n <= 1 ? n : fib(n-1) + fib(n-2); } 哪个函数调用首先被

首页

博学

6Ren·AI

商城

python - 多元时间序列的 Keras 递归神经网络