- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
BasicLSTM
单元的配置如下:
...
num_layers = 2
num_steps = 10
hidden_size = 200
...
我使用2隐藏层模型:
lstm_cell = rnn_cell.BasicLSTMCell(hidden_size, forget_bias=0.0)
cell = rnn_cell.MultiRNNCell([lstm_cell] * 2)
什么是cell.state_size
?
我得到的尺寸是 30 x 800,但我不明白它是怎么来的?
它似乎将 statesize
返回为 2 *unitsize
。但为什么状态大小应该是单元大小的两倍呢?
最佳答案
对于单个 BasicLSTMCell
,在您的情况下,状态是 (c=200, h=200)
的元组。 c
是 200 个单元(神经元)的细胞状态,h
是 200 个单元的隐藏状态。
为了理解这一点,请考虑一个普通的 RNN 单元。它只有一个隐藏状态从一次步骤传递到下一步。在 TensorFlow 中实现的 BasicRNNCell
就是这种情况。如果执行 tf.nn.rnn_cell.BasicRNNCell(200)
,其状态为 h=200 的单个整数。
LSTM 添加了一个额外的单元层用于纵向内存,其大小与隐藏层相同,因此 LSTM 的整体状态为 2x200 = 400。
this paper的介绍部分可能会有好处。
<小时/>不得不说 TensorFlow 的文档对于初学者来说有点过于简洁了。
关于tensorflow - TensorFlow 中 MultiRNNCell 的 state_size 是多少?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36732877/
我想在 Tensorflow 中创建一个多层双向 LSTM。目前我的单层模型如下所示: cell_fw = tf.contrib.rnn.LSTMCell(hidden_size) cell_bw =
有人可以帮忙解释一下 TensorFlow tf.contrib.rnn.MultiRnnCell 的内部机制吗? ? 例如,如果我想将两个基本的 RNN 单元堆叠成一个 MultiRnnCell ,
我正在尝试根据层将权重和偏差添加到张量板。我尝试过以下方法: tf.reset_default_graph() X = tf.placeholder(tf.float32, [None, n_step
我有一个堆叠式 MultiRNNCell,定义如下: batch_size = 256 rnn_size = 512 keep_prob = 0.5 lstm_1 = tf.nn.rnn_cell.L
我正在尝试使用以下代码(摘自 here )了解 TensorFlow(版本 1.3)中的 RNN 单元包装器。 import tensorflow as tf import numpy as np t
我正在尝试建立一个多元时间序列预测模型。我按照以下教程进行温度预测。 http://nbviewer.jupyter.org/github/addfor/tutorials/blob/master/m
BasicLSTM 单元的配置如下: ... num_layers = 2 num_steps = 10 hidden_size = 200 ... 我使用2隐藏层模型: lstm_cell =
在 Tensorflow 0.12 中,MultiRNNCell 的工作方式发生了变化,对于初学者,state_is_tuple 现在默认设置为 True ,此外,还有关于它的讨论: state_is
我想创建一个使用注意力机制的多层动态 RNN 解码器。为此,我首先创建一个注意力机制: attention_mechanism = BahdanauAttention(num_units=ATTENT
我有一个设置,我需要在使用 tf.initialize_all_variables() 的主要初始化之后初始化 LSTM。 IE。我想调用 tf.initialize_variables([var_l
我是一名优秀的程序员,十分优秀!