- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在用这个 [.config 文件][1] 训练一个 CNN:
rms_prop_optimizer: {
learning_rate: {
exponential_decay_learning_rate {
initial_learning_rate: 0.004
decay_steps: 800720
decay_factor: 0.95
}
}
momentum_optimizer_value: 0.9
decay: 0.9
epsilon: 1.0
}}
As you can see there is a rms_prop as optimizer. What if I would like to use Adam? How am I supposed to edit this file?
最佳答案
如果我是对的,您正在尝试将 object_detection 模型与 Tensorflow 提供的预训练网络一起使用,对吗?
然后,如果你懂一点编程,你可以看看models/research/object_detection/builders/optimizer_builder.py,看看哪些是可以使用的优化器,以及哪些参数。
相反,如果您只想要一个开箱即用的解决方案,我就是这样做的:
optimizer {
# momentum_optimizer {
adam_optimizer: {
learning_rate: {
manual_step_learning_rate {
initial_learning_rate: .0002
schedule {
step: 4500
learning_rate: .0001
}
schedule {
step: 7000
learning_rate: .00008
}
schedule {
step: 10000
learning_rate: .00004
}
}
}
# momentum_optimizer_value: 0.9
}
use_moving_average: false
}
momentum_optimizer
相同的 learning_experience 会使学习速度过快和/或带来 NaN 损失,因此我通常将其减少 10 倍或更多。我现在正在尝试。 :)
关于Tensorflow 对象检测 : use Adam instead of RMSProp,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51915803/
我有一些简单的循环神经网络的代码,想知道是否有办法减少更新阶段所需的代码量。我的代码是这样的: class RNN(object): def__init___(self, data, hidd
我正在用这个 [.config 文件][1] 训练一个 CNN: rms_prop_optimizer: { learning_rate: { exponential_decay_
快速提问: RMSProp 优化器是否与在线(随机,每轮更新权重)学习兼容?我能读到的只是关于RMSProp与小批量或全批量更新一起使用,但似乎没有一个明确 表明在线随机学习是不可能的。 最佳答案 非
decay_rate = 0.99 # decay factor for RMSProp leaky sum of grad^2 我对上面的评论措辞感到困惑,他们谈论了 RMSProp 优化器的“泄漏
这是一个link tensorflow 优化器。您可以看到,RMSprop 将动量作为参数,而 Adam 没有这样做。所以我很困惑。 Adam 优化假装是具有动量的 RMSprop 优化,如下所示:
我使用 tensorflow 2.1.0 和 keras 2.2.4tf当我想编译我的模型时[这里是我使用的一段代码]: model.compile(loss='binary_crossentropy
我使用 tensorflow 2.1.0 和 keras 2.2.4tf当我想编译我的模型时[这里是我使用的一段代码]: model.compile(loss='binary_crossentropy
我刚刚阅读了 Inception-v3 paper ,以及作者发布的训练代码。我发现什么时候做 RMSProp 优化,作者使用epsilon=1 .但是,据我所知,人们通常使用 1e-10 或一些较小
我应该避免将 L2 正则化与 RMSprop 和 NAG 结合使用吗? L2 正则化项会干扰梯度算法 (RMSprop)? 最诚挚的问候, 最佳答案 似乎有人已经解决了(2018)问题(2017)。
当您创建 RMSPRop 优化器时,它会要求提供动量值。这个势头是什么?是内斯特洛夫还是另一个?如何在 tf 中使用 Nesterov 动量和 RMSProp? 这里的文档字符串中有一个公式: htt
我正在 Tesla K40 上的图像数据集上使用 Caffe 进行微调。使用batch size=47、solver_type=SGD、base_lr=0.001、lr_policy="step"、m
我有一个以“h5”格式保存的模型。在使用 编译模型后,我正在尝试恢复训练并尝试加载优化器的权重 model.optimizer.set_weights(weights_list) 哪里weights_
我是一名优秀的程序员,十分优秀!