- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个具有三个隐藏层的神经网络,可以使用“纯”梯度下降或一些更复杂的技术进行训练。我还注意到,在我的问题中,基于动量的优化方法(adam、adadelta、动量)效果更好。
现在到有趣的部分了。根据设计,我想禁用神经网络第一层的动量。这意味着,我想在第二层和第三层中使用 Adam 更新权重,但在第一层中使用简单的梯度下降。
当然,我总是可以编写自己的优化器:使用 tf.gradients(loss, tf.trainable_variables()) 计算梯度,然后自己做动量技巧。但如果能够选择在每一层中使用特殊的优化器参数,那就太好了。有人听说过这样做的方法吗?
最佳答案
那么,您可以向优化器提供要优化的变量列表( docs ):
opt = tf.train.AdamOptimizer()
opt_op = opt.minimize(loss, var_list=[W1, b1])
opt2 = tf.train.GradientDescentOptimizer(learning_rate)
opt2_op = opt2.minimize(loss, var_list=[W2, b2])
您必须自己提取给定层的变量列表(可能是权重和偏差)。
关于machine-learning - 如何禁用 tensorflow 中特定层的动量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40782397/
如何计算滚动事件的滚动动量? 我知道在结束滚动的开始处必须有两个时间戳。还必须有一个“轴变化”变量,它基本上是无惯性滚动的量。 这是我当前负责结束滚动的代码: if ((type == kMXTEnd
这个问题在这里已经有了答案: How do I give this spaceship acceleration? (3 个答案) 关闭 5 年前。 有一个非常小的类似小行星的游戏片段,我正在使用不
我目前正在试验 THREE.JS 项目,并使用鼠标滚轮滚动事件从 0 转到 1。 但是,我希望实现与您在此链接 playdoh by merci Michael 中看到的相同势头。 目前,这就是我迄今
我正在尝试实现列表对象的动态滚动,但我在根据速度确定要应用的摩擦量(持续时间)时遇到问题。 我的 applyFriction() 方法根据持续时间属性平均降低滚动对象的速度。然而,对每个 Action
几个月来,我一直在努力解决这个问题,并且用尽了我能想到的一切。 我想要实现的是:http://blue.bluestudios.kenzomedia.com/v0.7/ (部分逻辑借鉴了iScroll
我有一个标准的前馈反向传播神经网络,我想训练它来识别蓝色的球。我有 30 张图像,其中 20 张是球的,10 张是没有球的,我的第一个问题是这是否足够,我假设拥有更多比更少更好,但很高兴知道是否有最少
有没有办法在 Google map V3 上禁用拖动惯性?看起来它应该是一个 MapOption,但我找不到任何方法来做到这一点。 最佳答案 我今天遇到了同样的问题,一些自定义 Div 漂浮在 map
当您创建 RMSPRop 优化器时,它会要求提供动量值。这个势头是什么?是内斯特洛夫还是另一个?如何在 tf 中使用 Nesterov 动量和 RMSProp? 这里的文档字符串中有一个公式: htt
我有一个 SGD 求解器: base_lr: 1e-2 lr_policy: "step" gamma: 0.1 stepsize: 10000 max_iter: 300000
我是一名优秀的程序员,十分优秀!