machine-learning - 如何禁用 tensorflow 中特定层的动量？-6ren

machine-learning - 如何禁用 tensorflow 中特定层的动量？

转载作者：行者123 更新时间：2023-11-30 08:46:40

26

4

我有一个具有三个隐藏层的神经网络，可以使用“纯”梯度下降或一些更复杂的技术进行训练。我还注意到，在我的问题中，基于动量的优化方法(adam、adadelta、动量)效果更好。

现在到有趣的部分了。根据设计，我想禁用神经网络第一层的动量。这意味着，我想在第二层和第三层中使用 Adam 更新权重，但在第一层中使用简单的梯度下降。

当然，我总是可以编写自己的优化器:使用 tf.gradients(loss, tf.trainable_variables()) 计算梯度，然后自己做动量技巧。但如果能够选择在每一层中使用特殊的优化器参数，那就太好了。有人听说过这样做的方法吗？

最佳答案

那么，您可以向优化器提供要优化的变量列表( docs ):

opt = tf.train.AdamOptimizer()
opt_op = opt.minimize(loss, var_list=[W1, b1])
opt2 = tf.train.GradientDescentOptimizer(learning_rate)
opt2_op = opt2.minimize(loss, var_list=[W2, b2])

您必须自己提取给定层的变量列表(可能是权重和偏差)。

关于machine-learning - 如何禁用 tensorflow 中特定层的动量？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40782397/

26

4

0

文章推荐： javascript - Kendo Ui - 检查事件是否存在

文章推荐： javascript - 检查元素中的类是否等于值javascript

文章推荐： matlab - 多个数据集上的 PCA(主成分分析)

计算滚动惯性/动量？
如何计算滚动事件的滚动动量？我知道在结束滚动的开始处必须有两个时间戳。还必须有一个“轴变化”变量，它基本上是无惯性滚动的量。这是我当前负责结束滚动的代码: if ((type == kMXTEnd
javascript - 我如何给这个元素惯性/动量？
这个问题在这里已经有了答案: How do I give this spaceship acceleration? (3 个答案) 关闭 5 年前。有一个非常小的类似小行星的游戏片段，我正在使用不
javascript - 鼠标滚轮事件 - 速度/动量
我目前正在试验 THREE.JS 项目，并使用鼠标滚轮滚动事件从 0 转到 1。但是，我希望实现与您在此链接 playdoh by merci Michael 中看到的相同势头。目前，这就是我迄今
actionscript-3 - 基于速度的动态滚动(动量)持续时间？
我正在尝试实现列表对象的动态滚动，但我在根据速度确定要应用的摩擦量(持续时间)时遇到问题。我的 applyFriction() 方法根据持续时间属性平均降低滚动对象的速度。然而，对每个 Action
javascript - 在 iScroll4 中无限滚动或改善惯性/动量
几个月来，我一直在努力解决这个问题，并且用尽了我能想到的一切。我想要实现的是:http://blue.bluestudios.kenzomedia.com/v0.7/ (部分逻辑借鉴了iScroll
machine-learning - 需要帮助设置神经网络参数(学习率、动量、隐藏层大小......)
我有一个标准的前馈反向传播神经网络，我想训练它来识别蓝色的球。我有 30 张图像，其中 20 张是球的，10 张是没有球的，我的第一个问题是这是否足够，我假设拥有更多比更少更好，但很高兴知道是否有最少
google-maps - 在 Google map V3 上禁用拖动惯性/动量
有没有办法在 Google map V3 上禁用拖动惯性？看起来它应该是一个 MapOption，但我找不到任何方法来做到这一点。最佳答案我今天遇到了同样的问题，一些自定义 Div 漂浮在 map
machine-learning - tensorflow 中的 RMSProp 优化器是否使用 Nesterov 动量？
当您创建 RMSPRop 优化器时，它会要求提供动量值。这个势头是什么？是内斯特洛夫还是另一个？如何在 tf 中使用 Nesterov 动量和 RMSProp？这里的文档字符串中有一个公式: htt
machine-learning - 动量 0.9 和 0.99 新元
我有一个 SGD 求解器: base_lr: 1e-2 lr_policy: "step" gamma: 0.1 stepsize: 10000 max_iter: 300000

首页

博学

6Ren·AI

商城

machine-learning - 如何禁用 tensorflow 中特定层的动量？