gpt4 book ai didi

python - Adagrad 如何在 Keras 中工作? Keras Optimizer 中的 self.weights 是什么意思?

转载 作者:太空宇宙 更新时间:2023-11-03 10:55:24 25 4
gpt4 key购买 nike

比如Keras的Adagrad的实现一直是:

class Adagrad(Optimizer):
"""Adagrad optimizer.
It is recommended to leave the parameters of this optimizer
at their default values.
# Arguments
lr: float >= 0. Learning rate.
epsilon: float >= 0.
decay: float >= 0. Learning rate decay over each update.
# References
- [Adaptive Subgradient Methods for Online Learning and Stochastic Optimization](http://www.jmlr.org/papers/volume12/duchi11a/duchi11a.pdf)
"""

def __init__(self, lr=0.01, epsilon=1e-8, decay=0., **kwargs):
super(Adagrad, self).__init__(**kwargs)
self.lr = K.variable(lr)
self.epsilon = epsilon
self.decay = K.variable(decay)
self.initial_decay = decay
self.iterations = K.variable(0.)

def get_updates(self, params, constraints, loss):
grads = self.get_gradients(loss, params)
shapes = [K.get_variable_shape(p) for p in params]
accumulators = [K.zeros(shape) for shape in shapes]
self.weights = accumulators
self.updates = []

lr = self.lr
if self.initial_decay > 0:
lr *= (1. / (1. + self.decay * self.iterations))
self.updates.append(K.update_add(self.iterations, 1))

for p, g, a in zip(params, grads, accumulators):
new_a = a + K.square(g) # update accumulator
self.updates.append(K.update(a, new_a))
new_p = p - lr * g / (K.sqrt(new_a) + self.epsilon)
# apply constraints
if p in constraints:
c = constraints[p]
new_p = c(new_p)
self.updates.append(K.update(p, new_p))
return self.updates

函数“get_update()”似乎一步更新。但是累加器应该存储历史信息吗?为什么它在每一步都被初始化为零?如何在整个训练过程中成为一个累加器?

这条线是做什么的?

self.weights = accumulators

self.weights 似乎再也没有被调用过。

最佳答案

你是对的.. 对于 Keras 中的所有优化器 get_updates() 实现一步更新的张量逻辑。此函数为来自 _make_train_function() 的每个 model.fit() 调用一次 here ,用于通过将更新规则作为 update= here 传递来创建张量函数.此更新规则用于迭代到迭代以更新模型参数和其他参数。

优化器类的

self.weights 是它的内部参数。这不用于训练。它只是用于保持优化器的状态(指向参数/累加器张量的指针列表),当调用 model.save 时,它们也会通过调用 get_weights() here并在 set_weights() 调用 model.load 时加载回来 here

关于python - Adagrad 如何在 Keras 中工作? Keras Optimizer 中的 self.weights 是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41787873/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com