tensorflow - Tensorflow text_generation 教程中有状态 GRU 的误导性训练数据混洗-6ren

tensorflow - Tensorflow text_generation 教程中有状态 GRU 的误导性训练数据混洗

转载作者：行者123 更新时间：2023-12-05 07:11:03

26

4

我正在查看 Tensorflow text_generation 教程 (https://www.tensorflow.org/tutorials/text/text_generation)，想知道为什么尽管 GRU 层的状态设置为 TRUE，但它们仍在随机播放训练数据？

这与文档相矛盾 ( https://www.tensorflow.org/api_docs/python/tf/keras/layers/RNN ):“关于在 RNN 中使用有状态的注意事项:您可以将 RNN 层设置为‘有状态’，这意味着为一批中的样本计算的状态将被重新用作下一批中样本的初始状态。这假设不同连续批处理中样本之间的一对一映射。”

教程中的代码片段:

dataset = dataset.shuffle(BUFFER_SIZE).batch(BATCH_SIZE, drop_remainder=True)

tf.keras.layers.GRU(rnn_units,
                        return_sequences=True,
                        stateful=True,
                        recurrent_initializer='glorot_uniform')

最佳答案

文档有误。我按照 TensorFlow 文档中的步骤进行操作，但是当我设置 stateful=False 时，我使用随机数据获得了更好的结果。

关于tensorflow - Tensorflow text_generation 教程中有状态 GRU 的误导性训练数据混洗，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60934038/

26

4

0

文章推荐： c# - 如何从工作流对话框中删除标题中的问号？

文章推荐： javascript - 使用 HTML5 播放双音频 MKV/AVI 视频

python - GRU加载模型错误，ValueError : GRU(reset_after=False) is not compatible with GRU(reset_after=True)
我是 ML 框架和 Python 的新手。我从 https://github.com/xiaochus/TrafficFlowPrediction 获得了 keras-tensorflow 项目的源代
python - GRU加载模型错误，ValueError : GRU(reset_after=False) is not compatible with GRU(reset_after=True)
我是 ML 框架和 Python 的新手。我从 https://github.com/xiaochus/TrafficFlowPrediction 获得了 keras-tensorflow 项目的源代
python - Keras GRU/LSTM层输入维度错误
我对深度学习有点陌生，我一直在尝试使用深度学习方法进行自然语言处理并使用路透社数据集创建一个简单的情感分析器。这是我的代码: import numpy as np from keras.dataset
python - word2vec的RNN模型(GRU)回归未学习
我将Keras代码转换为PyTorch，是因为我比前者更熟悉后者。但是，我发现它不是在学习（或只是勉强学习）。下面，我提供了几乎所有的PyTorch代码，包括初始化代码，以便您可以自己尝试。您唯一需
tensorflow - keras GRU 层中的返回状态和返回序列有什么区别？
我似乎无法理解 keras GRU 层中返回状态和返回序列之间的差异。由于 GRU 单元没有单元状态(它等于输出)，那么返回状态与 keras GRU 层中的返回序列有何不同？更具体地说，我构建了
deep-learning - PyTorch GRU 中隐藏状态的层顺序返回
这是我正在查看的 API，https://pytorch.org/docs/stable/nn.html#gru 它输出: output形状(seq_len，batch，num_directions
graph-databases - 一键安装 - Dgraph - Gru
我安装了 dgraph gru 用于面试 go get github.com/dgraph-io/gru cd $GOPATH/src/github.com/dgraph-io/gru git che
tensorflow - 如何提高 LSTM、GRU 循环神经网络的分类精度
Tensorflow 中的二元分类问题: 我已经阅读了在线教程并尝试使用门控循环单元 (GRU) 将其应用于实时问题。我已经尝试了所有我知道的改进分类的可能性。 1) 开始添加堆叠的 RNN(GRU)
python - GRU 和 RNN 实现之间的不一致
我正在尝试使用 Tensorflow 实现一些自定义 GRU 单元。我需要堆叠这些单元格，并且我想继承 tensorflow.keras.layers.GRU 。但是，在查看源代码时，我注意到只能将
python - 如何使用经过训练的 Keras GRU 模型预测新的数据系列？
我正在尝试使用训练有素的 Keras 序列模型 (GRU) 来预测一些新的数据样本，但在创建时间序列生成器时遇到一些问题。在训练过程中，使用 model.predict_generator() 预测
keras - 理解 GRU 架构 - Keras
我正在使用 Mycroft AI 唤醒词检测，并试图了解网络的维度。以下几行显示了 Keras 中的模型: model = Sequential() model.add(GRU( pa
machine-learning - LSTM/GRU 自动编码器收敛
目标尝试在多变量时间序列数据集上运行 LSTM 自动编码器: X_train (200, 23, 178) - X_val (100, 23, 178) - X_test (100, 23, 178
python - 如何使用 Keras GRU 在多参数天气时间序列上实际预测一个参数
在 Keras 书籍 (F. Chollet) 中关于耶拿天气数据集(第 #6 章)的 GRU 架构训练之后，我很难理解预测阶段: 最后一层 - 密集，无激活 - 按预期输出数字流:尺寸:行数 X 1
python - Keras LSTM/GRU 语言模型的输入形状
我正在尝试在 Keras 中训练单词级别的语言模型。我有 X 和 Y，形状都是 (90582L, 517L) 当我尝试拟合这个模型时: print('Build model...') model =
python - Theano 中的 GRU 实现
根据 Theano 官方教程(http://deeplearning.net/tutorial/code/lstm.py)中提供的 LSTM 代码，我更改了 LSTM 层代码(即函数 lstm_lay
python - 获取具有可变序列长度的激活时出现 Tensorflow GRU 单元错误
我想在一些时间序列数据上运行 GRU 单元，根据最后一层的激活对它们进行聚类。我对 GRU 单元实现做了一个小改动 def __call__(self, inputs, state, scope=No
pytorch lstm gru rnn 得到每个state输出的操作
默认只返回最后一个state，所以一次输入一个step的input ?
tensorflow - Tensorflow text_generation 教程中有状态 GRU 的误导性训练数据混洗
我正在查看 Tensorflow text_generation 教程 (https://www.tensorflow.org/tutorials/text/text_generation)，想知道为
tensorflow - 计算 GRU 层(Keras)的参数数量
为什么GRU层的参数个数是9600？不应该是 ((16+32)*32 + 32) * 3 * 2 = 9,408 吗？或者，重新排列， 32*(16 + 32 + 1)*3*2 = 9408 mo
neural-network - Tensorflow 中 GRU 单元的解释？
以下是 Tensorflow 的代码 GRUCell当先前的隐藏状态与序列中的当前输入一起提供时，单元显示了获得更新隐藏状态的典型操作。 def __call__(self, inputs, st

首页

博学

6Ren·AI

商城

tensorflow - Tensorflow text_generation 教程中有状态 GRU 的误导性训练数据混洗