r - 了解 R 中 rnn 模型的 Keras 预测输出-6ren

r - 了解 R 中 rnn 模型的 Keras 预测输出

转载作者：行者123 更新时间：2023-11-30 08:23:34

我正在通过执行有关预测温度的 tutorial 来尝试 R 中的 Keras 包。然而，该教程没有解释如何使用经过训练的 RNN 模型进行预测，我想知道如何做到这一点。为了训练模型，我使用了从教程中复制的以下代码:

dir.create("~/Downloads/jena_climate", recursive = TRUE)
download.file(
    "https://s3.amazonaws.com/keras-datasets/jena_climate_2009_2016.csv.zip",
      "~/Downloads/jena_climate/jena_climate_2009_2016.csv.zip"
    )
unzip(
  "~/Downloads/jena_climate/jena_climate_2009_2016.csv.zip",
  exdir = "~/Downloads/jena_climate"
)

library(readr)
data_dir <- "~/Downloads/jena_climate"
fname <- file.path(data_dir, "jena_climate_2009_2016.csv")
data <- read_csv(fname)

data <- data.matrix(data[,-1])

train_data <- data[1:200000,]
mean <- apply(train_data, 2, mean)
std <- apply(train_data, 2, sd)
data <- scale(data, center = mean, scale = std)

generator <- function(data, lookback, delay, min_index, max_index,
                      shuffle = FALSE, batch_size = 128, step = 6) {
  if (is.null(max_index))
    max_index <- nrow(data) - delay - 1
  i <- min_index + lookback
  function() {
    if (shuffle) {
      rows <- sample(c((min_index+lookback):max_index), size = batch_size)
    } else {
      if (i + batch_size >= max_index)
        i <<- min_index + lookback
      rows <- c(i:min(i+batch_size, max_index))
      i <<- i + length(rows)
    }

    samples <- array(0, dim = c(length(rows), 
                                lookback / step,
                                dim(data)[[-1]]))
    targets <- array(0, dim = c(length(rows)))

    for (j in 1:length(rows)) {
      indices <- seq(rows[[j]] - lookback, rows[[j]], 
                     length.out = dim(samples)[[2]])
      samples[j,,] <- data[indices,]
      targets[[j]] <- data[rows[[j]] + delay,2]
    }            

    list(samples, targets)
  }
}

lookback <- 1440
step <- 6
delay <- 144
batch_size <- 128

train_gen <- generator(
  data,
  lookback = lookback,
  delay = delay,
  min_index = 1,
  max_index = 200000,
  shuffle = TRUE,
  step = step, 
  batch_size = batch_size
)

val_gen = generator(
  data,
  lookback = lookback,
  delay = delay,
  min_index = 200001,
  max_index = 300000,
  step = step,
  batch_size = batch_size
)

test_gen <- generator(
  data,
  lookback = lookback,
  delay = delay,
  min_index = 300001,
  max_index = NULL,
  step = step,
  batch_size = batch_size
)

# How many steps to draw from val_gen in order to see the entire validation set
val_steps <- (300000 - 200001 - lookback) / batch_size

# How many steps to draw from test_gen in order to see the entire test set
test_steps <- (nrow(data) - 300001 - lookback) / batch_size

library(keras)

model <- keras_model_sequential() %>% 
  layer_flatten(input_shape = c(lookback / step, dim(data)[-1])) %>% 
  layer_dense(units = 32, activation = "relu") %>% 
  layer_dense(units = 1)

model %>% compile(
  optimizer = optimizer_rmsprop(),
  loss = "mae"
)

history <- model %>% fit_generator(
  train_gen,
  steps_per_epoch = 500,
  epochs = 20,
  validation_data = val_gen,
  validation_steps = val_steps
)

我尝试使用下面的代码来预测温度。如果我是正确的，这应该给我每批的标准化预测温度。因此，当我对这些值进行非规范化并对其进行平均时，我得到了预测的温度。这是正确的吗？如果正确，则预测哪个时间(最新观察时间 + 延迟？)？

prediction.set <- test_gen()[[1]]
prediction <- predict(model, prediction.set)

此外，使用 keras::predict_generator() 和 test_gen() 函数的正确方法是什么？如果我使用以下代码:

model %>% predict_generator(generator = test_gen,
                            steps = test_steps)

它给出了这个错误:

error in py_call_impl(callable, dots$args, dots$keywords) : 
 ValueError: Error when checking model input: the list of Numpy
 arrays that you are passing to your model is not the size the model expected. 
 Expected to see 1 array(s), but instead got the following list of 2 arrays: 
 [array([[[ 0.50394005,  0.6441838 ,  0.5990761 , ...,  0.22060473,
          0.2018686 , -1.7336458 ],
        [ 0.5475698 ,  0.63853574,  0.5890239 , ..., -0.45618412,
         -0.45030192, -1.724062...

最佳答案

注意:我对 R 语法的熟悉程度很低，因此遗憾的是我无法使用 R 为您提供答案。相反，我在答案中使用 Python。我希望你能轻松地将我的话翻译回 R。

<小时/>

... If I am correct, this should give me the normalized predicted temperature for every batch.

是的，没错。由于您已经使用标准化标签对其进行了训练，因此预测将被标准化:

data <- scale(data, center = mean, scale = std)

因此，您需要使用计算的平均值和标准差对值进行非规范化，以找到真正的预测:

pred = model.predict(test_data)
denorm_pred = pred * std + mean

... for which time is then predicted (latest observation time + delay?)

没错。具体来说，由于在此特定数据集中每十分钟记录一次新的观测值并且您设置了延迟=144，因此这意味着预测值是提前 24 小时的温度(即 144 * 10 = 1440分钟 = 24 小时)距离上次给定的观察。

Also, what is the correct way to use keras::predict_generator() and the test_gen() function?

predict_generator采用一个生成器，它仅提供测试样本作为输出，而不提供标签(因为我们在执行预测时不需要标签；在训练时需要标签，即 fit_generator() 和评估时)模型，即 evaluate_generator() )。这就是为什么错误提到您需要传递一个数组而不是两个数组。因此，您需要定义一个仅提供测试样本的生成器，或者在Python中，一种替代方法是将现有的生成器包装在另一个仅提供输入样本的函数中(我不知道您是否可以在R中执行此操作) ):

def pred_generator(gen):
    for data, labels in gen:
        yield data  # discards labels

preds = model.predict_generator(pred_generator(test_generator), number_of_steps)

您需要提供另一个参数，即生成器覆盖测试数据中所有样本的步数。实际上我们有num_steps =total_number_of_samples/batch_size。例如，如果您有 1000 个样本，每次生成器生成 10 个样本，则需要使用生成器执行 1000/10 = 100 步骤。

奖励:要查看模型的性能如何，您可以使用现有的测试生成器(即 test_gen)来使用 evaluate_generator:

loss = model.evaluate_generator(test_gen, number_of_steps)

给定的loss也是标准化的，要对其进行非标准化(为了更好地了解预测误差)，您只需将其乘以std(您不需要需要添加 mean 因为您使用的是 mae，即平均绝对误差，作为损失函数):

denorm_loss = loss * std

这会告诉您您的预测平均偏离多少。例如，如果您要预测温度，denorm_loss 为 5 意味着预测平均偏离 5 度(即低于或高于实际值)。

<小时/>

更新:对于预测，您可以使用 R 中的现有生成器定义新的生成器，如下所示:

pred_generator <- function(gen) {
  function() { # wrap it in a function to make it callable
    gen()[1]  # call the given generator and get the first element (i.e. samples)
  }
}

preds <- model %>% 
  predict_generator(
    generator = pred_generator(test_gen), # pass test_gen directly to pred_generator without calling it
    steps = test_steps
  )

evaluate_generator(model, test_gen, test_steps)

关于r - 了解 R 中 rnn 模型的 Keras 预测输出，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49032027/

文章推荐： apache-spark - Apache Spark 是否不如 Scikit Learn 准确？

文章推荐： java - LibGDX - 查看当前设备是否支持给定的屏幕分辨率

文章推荐： java - 来自属性 GS 集合 Java 的不同对象

文章推荐： javascript - Lodash 获取在唯一 id 下具有最低值的项目

Tensorflow:我的 rnn 总是输出相同的值，rnn 的权重没有经过训练
我使用 tensorflow 实现了一个简单的 RNN 模型来学习时间序列数据的可能趋势并预测 future 值。然而，该模型总是在训练后产生相同的值。实际上，它得到的最佳模型是: y = b. RN
tensorflow - 属性错误: 'tensorflow.python.ops.rnn' has no attribute 'rnn'
我正在关注this tutorial关于循环神经网络。这是导入: import tensorflow as tf from tensorflow.examples.tutorials.mnist i
python - pure-python RNN 和 theano RNN 计算不同的梯度——提供的代码和结果
一段时间以来，我一直在苦思冥想，无法弄清楚我在实现这些 RNN 时做错了什么(如果有的话)。为了让你们省去前向阶段，我可以告诉你们这两个实现计算相同的输出，所以前向阶段是正确的。问题出在倒退阶段。这
tensorflow - RNN 模型不学习任何东西
我正在用 RNN 练习。我随机创建 5 个整数。如果第一个整数是奇数，则 y 值为 1，否则 y 为 0(因此，只有第一个 x 有效)。问题是，当我运行这个模型时，它不会“学习”:val_loss 和
Tensorflow RNN 权重矩阵初始化
我正在使用 bidirectional_rnn与 GRUCell但这是一个关于 Tensorflow 中 RNN 的普遍问题。我找不到如何初始化权重矩阵(输入到隐藏，隐藏到隐藏)。它们是随机初始化的
用于命名实体识别的 TensorFlow RNN
我正在尝试找出适应开放命名实体识别问题的最佳模型(生物学/化学，因此不存在实体字典，但必须通过上下文来识别它们)。目前我最好的猜测是调整 Syntaxnet，这样它就不会将单词标记为 N、V、ADJ
python - RNN 从哪里获取批量大小？
我正在通过以下方式训练 RNN: def create_rnn_model(stateful,length): model = Sequential() model.add(Simpl
python - RNN 参数没有更新？
我对 PyTorch 非常陌生，而且对一般神经网络也相当陌生。我试图构建一个可以猜测性别名字的神经网络，并且基于判断国籍的 PyTorch RNN 教程。我的代码运行没有错误，但损失几乎没有变化，
tensorflow - 我应该使用什么损失函数和指标来训练返回类别序列的 RNN？
我正在尝试训练一个模型，返回单词序列(RNN)的类。我为我的模型提供一系列嵌入: [ batchSize, sequence_length, word_embedding ] as float[]
python - RNN 不会对简单数据过度拟合
我正在尝试预测输入向量中每个数字的类别。有3个类(class)。如果输入值从 0 变为 1，则为 1 类。如果从 1 变为 0，则为 2 类。否则为 0 类。在第二个纪元之后，精度停留在 0.882
python - 有没有一种方法可以让我们在不使用热编码器的情况下训练 RNN？
我正在尝试为我的日志分析项目开发一个顺序 RNN。输入是一个日志序列，例如 [1,2,3,4,5,6,1,5,2,7,8,2,1] 目前我正在使用 keras 库中的 to_categorical
python - RNN LSTM估计正弦波频率和相位
为了加深我对 RNN 和 LSTM 的理解，我正在尝试实现一个简单的 LSTM 来估计正弦波的频率和相位。事实证明，这出奇地难以收敛。 MSE 相当高(以千为单位)唯一似乎有点工作的是，如果我生成所有
python - RNN 模型上的网格搜索时训练数据的形状不正确
请帮助我编写以下代码，当我尝试直接在数据上拟合模型时，该代码运行良好，但在网格搜索上失败(我已注释掉直接 model.fit()我的 grid.fit() 语句末尾的部分，这给了我满意的结果。还请告诉
python - RNN 中的隐藏大小与输入大小
前提1: 关于 RNN 层中的神经元 - 我的理解是，在“每个时间步，每个神经元都接收输入向量 x (t) 和前一个时间步的输出向量 y (t –1)”[1]: 前提2: 据我了解，在 Pytorch
python - 用于回归层的 RNN
我想训练一个 RNN 来解决一个简单的回归问题。我有一个形状为 (35584,) 的数组 X_train，它表示几年来每小时的测量值。我还有相应的 Y_train 形状为 (35584,) 作为预期值
java - Rnn 神经网络预测返回意想不到的预测
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 4 年前。 Improve this qu
解决pytorch rnn 变长输入序列的问题
pytorch实现变长输入的rnn分类输入数据是长度不固定的序列数据，主要讲解两个部分 1、Data.DataLoader的collate_fn用法，以及按batch进行padding数据
基于循环神经网络(RNN)的古诗生成器
基于循环神经网络(RNN)的古诗生成器，具体内容如下之前在手机百度上看到有个“为你写诗”功能，能够随机生成古诗，当时感觉很酷炫= = 在学习了深度学习后，了解了一下原理，打算自己做个实现练练手
基于循环神经网络(RNN)实现影评情感分类
使用循环神经网络(RNN)实现影评情感分类作为对循环神经网络的实践，我用循环神经网络做了个影评情感的分类，即判断影评的感情色彩是正面的，还是负面的。选择使用RNN来做情感分类，主要是因为影评
tensorflow - 如何构建一个从输出到下一个输入有大量额外循环的 RNN 模型？
我的目标是在 Keras/TensorFlow 中构建一个 RNN，它由循环单元层(GRU、LSTM 等)以及从网络底部到顶部的循环组成，以添加注意力机制或特殊的内存类型。我不熟悉符号循环，所以首先我

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 了解 R 中 rnn 模型的 Keras 预测输出