- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我刚刚开始研究循环神经网络。我在 Elman 的网络上找到了三个信息来源(Elman 1991)。
(纸质)http://www.sysc.pdx.edu/classes/Werbos-Backpropagation%20through%20time.pdf
(问答)Elman and Jordan context values during training for neural network
根据第一个资源,从隐藏层到上下文/上下文到隐藏层的权重没有更新。
在第二个资源中,它还将这些更新设置为 0,这意味着它不会更新权重。
但在 Stackoverflow 上的第三个资源中,用户声称“上下文神经元神经元值本身不会随着训练的进行而更新。它们与下一层之间的权重已更新在训练期间。”
我理解上下文神经元在时间 t 保存隐藏神经元的值,并在 t + 1 将其(与输入神经元一起)馈送到隐藏神经元。但是我们是否必须更新其间的权重?
最佳答案
我不确定这个问题是否仍然重要,但这是我的解释:
从隐藏层到上下文层的权重固定为 1。这些权重不会更新。
但是,从上下文层返回到隐藏层的权重将会更新。否则网络如何学习如何处理过去的值?如果它们不改变,初始化它们的正确值是多少?当然不是 1。
上下文神经元的值将在训练期间更新。不是通过使用某种 sigmoid 函数,而是通过简单地复制隐藏层的值。
关于machine-learning - 递归神经网络(Elman 网络)。上下文到隐藏层/隐藏到上下文层的权重需要更新吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19109746/
我正在尝试使用 Pybrain 创建 Elman 网络(又名简单循环网络),我认为代码应该如下所示: n = RecurentNetwork() n.addInputModule(LinearLaye
问:Tensorflow RNN 是否实现了输出 Elman 网络的隐藏状态? cells = tf.contrib.rnn.BasicRNNCell(4) outputs, state = tf.
我刚刚开始研究循环神经网络。我在 Elman 的网络上找到了三个信息来源(Elman 1991)。 (示例和代码)http://mnemstudio.org/neural-networks-elman
我是一名优秀的程序员,十分优秀!