python - 如何在 python theano 中编写 adagrad-6ren

python - 如何在 python theano 中编写 adagrad

转载作者：行者123 更新时间：2023-11-28 19:55:12

24

4

为了简化问题，假设一个维度(或特征)已经更新了 n 次，下次我看到该特征时，我想将学习率设置为 1/n。

我想出了这些代码:

def test_adagrad():
  embedding = theano.shared(value=np.random.randn(20,10), borrow=True)
  times = theano.shared(value=np.ones((20,1)))
  lr = T.dscalar()
  index_a = T.lvector()
  hist = times[index_a]
  cost = T.sum(theano.sparse_grad(embedding[index_a]))
  gradients = T.grad(cost, embedding)
  updates = [(embedding, embedding+lr*(1.0/hist)*gradients)]
  ### Here should be some codes to update also times which are omitted ### 
  train = theano.function(inputs=[index_a,   lr],outputs=cost,updates=updates)
  for i in range(10):
    print train([1,2,3],0.05)

Theano 没有给出任何错误，但训练结果有时给出 Nan。请问有人知道如何纠正这个问题吗？

谢谢你的帮助

PS:我怀疑是稀疏空间中的操作造成了问题。所以我尝试用 theano.sparse.mul 替换 *。这给出了我之前提到的一些结果

最佳答案

也许您可以利用以下 example for implementation of adadelta ，并用它来推导你自己的。如果成功请更新:-)

关于python - 如何在 python theano 中编写 adagrad，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29365370/

24

4

0

文章推荐： Python - 使用 For 循环水平翻转图像

文章推荐： iOS 在 UITableViewCell 中均匀间隔 5 个标签

文章推荐： python - 文件末尾的意外缩进错误

文章推荐： javascript - 让我的功能变得更好

python - 在 Python 中实现 Adagrad
我正尝试在 Python 中实现 Adagrad。出于学习目的，我以矩阵分解为例。我会使用 Autograd用于计算梯度。我的主要问题是实现是否正常。问题描述给定一个矩阵 A (M x N)，其
tensorflow - TensorFlow 中的梯度下降、Adagrad 与 Momentum
我正在研究TensorFlow以及如何使用它，即使我不是神经网络和深度学习方面的专家(只是基础知识)。根据教程，我不明白这三个优化器之间的真正和实际的差异。我看API我了解原理，但我的问题是: 1。
python - 如何在 python theano 中编写 adagrad
为了简化问题，假设一个维度(或特征)已经更新了 n 次，下次我看到该特征时，我想将学习率设置为 1/n。我想出了这些代码: def test_adagrad(): embedding = the
python - Tensorflow:您在 Adam 和 Adagrad 中设置的学习率只是初始学习率吗？
我正在阅读此博客 https://smist08.wordpress.com/2016/10/04/the-road-to-tensorflow-part-10-more-on-optimizatio
python - Adagrad 如何在 Keras 中工作？ Keras Optimizer 中的 self.weights 是什么意思？
比如Keras的Adagrad的实现一直是: class Adagrad(Optimizer): """Adagrad optimizer. It is recommended to leave th

首页

博学

6Ren·AI

商城

python - 如何在 python theano 中编写 adagrad