theano - 定期记录梯度而不需要 Theano 中的两个函数(或减速)-6ren

theano - 定期记录梯度而不需要 Theano 中的两个函数(或减速)

转载作者：行者123 更新时间：2023-12-01 13:40:03

25

4

出于诊断目的，我定期获取网络的梯度。一种方法是将梯度作为 theano 函数的输出返回。然而，每次都将梯度从 GPU 复制到 CPU 内存可能代价高昂，所以我宁愿只定期进行。目前，我通过创建两个函数对象来实现这一点，一个返回渐变，一个不返回。

但是，我不知道这是否是最优的，我正在寻找一种更优雅的方式来实现同样的目标。

最佳答案

您的第一个函数显然执行训练步骤并更新所有参数。

第二个函数必须返回参数的梯度。

完成您要求的最快方法是将训练步骤的更新添加到第二个函数，并且在记录梯度时，不要调用第一个函数，而只调用第二个函数。

gradients = [ ... ]
train_f = theano.function([x, y], [], updates=updates)
train_grad_f = theano.function([x, y], gradients, updates=updates)
num_iters = 1000
grad_array = []
for i in range(num_iters):
   # every 10 training steps keep log of gradients
   if i % 10 == 0:
       grad_array.append(train_grad_f(...))
   else:
       train_f(...)

更新

如果你希望有一个单一的功能来做到这一点，你可以这样做

from theano.ifelse import ifelse

no_grad = T.iscalar('no_grad')
example_gradient = T.grad(example_cost, example_variable)

# if no_grad is > 0 then return the gradient, otherwise return zeros array
out_grad = ifelse(T.gt(no_grad,0), example_gradient, T.zeros_like(example_variable))

train_f = theano.function([x, y, no_grad], [out_grad], updates=updates)

所以当你想检索你调用的渐变

train_f(x_data, y_data, 1)

否则

train_f(x_data, y_data, 0)

关于theano - 定期记录梯度而不需要 Theano 中的两个函数(或减速)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41068057/

25

4

0

文章推荐： caching - InterSystems Cache，在哪里可以找到全局定义

文章推荐： sql - 列中的子字符串

文章推荐： gephi - 如何在 gephi 中进行力定向边捆绑？

c++ - 帧率独立加速/减速？
我正在用 C++ 编写一个粒子模拟器。我通过在每个时间步将它们的速度添加到它们的位置来移动粒子。时间步的值是当前帧的百分比。所以全帧时间步长为1，半帧时间步长为0.5，四分之一帧时间步长为0.25
Linux下“减速”查看日志的方法
Linux下“减速”查看日志的方法需求场景今天查看日志，有个需求，需要按照指定“速率”输出日志信息到终端屏幕上，方便查看。这个需求日常应该也经常会碰到，比如以下两种情况：
iphone - 停用 UIScrollView 减速
有没有办法取消 UIScrollView 的减速？我想允许用户滚动 Canvas ，但我不希望用户抬起手指后 Canvas 继续滚动。最佳答案这可以通过利用 UIScrollView 委托(de
随着数据库的增长，SQLite 减速(滚动日志)
我在我的 c 应用程序中遇到大量 sqlite 减速问题，并且不知道这是意料之中还是我没有正确使用 sqlite。数据库使用滚动日志，如 http://dt.deviantart.com/jour
iphone - 停用 UIScrollView 减速
有没有办法取消 UIScrollView 的减速？我想允许用户滚动 Canvas ，但我不希望用户抬起手指后 Canvas 继续滚动。最佳答案这可以通过利用 UIScrollView 委托(de
iphone - 如何使拖动的 UIView 减速？
我有一个可以用手指拖动的 UIView，这是我使用 UIPanGestureRecognizer 实现的。这允许我水平拖动 View ；向左或向右。我在从 UIPanGestureRecognize
java - Jedis(Redis)减速
我正在向 Redis 中插入大量文本以逐行存储频率。但是，jedis/redis 会变慢，并且在执行一定数量的操作后需要花费大量时间e 操作并且程序以错误结束:java.lang.OutOfMemor
ios - 模拟 UIScrollView 减速
我有一个 UIPanGestureRecognize，我用它来更改 View 的框架。当手势状态为 UIGestureRecognizerStateEnded 时，有没有办法模拟 UIScrollVi
uiscrollview - 检测 MKMapView 的平移 + 减速
我正在尝试在 MKMapView 上捕获平移和“滚动结束”。使用手势识别器可以轻松实现平移。然而，MKMapView 似乎没有在 iOS 6 中实现 UIScrollViewDelegate。这使得解
Python:多处理的非常奇怪的行为；后面的代码导致前面代码的 "retroactive"减速
我正在尝试学习如何实现多处理来计算蒙特卡洛模拟。我从 this simple tutorial 复制了代码目的是计算积分。我还将它与 answer from WolframAlpha 进行了比较并计算
javascript - 为什么具有非常高索引号的 javascript 数组会导致崩溃/减速/麻烦？
基本上破坏我的 node js express 服务器的代码是这样的: resultArr = []; resultArr["test"] = []; resultArr["test"][201507
amazon-web-services - S3 减速 : Please reduce your request rate exception
我有一个服务，每秒向 S3 发送 10k PUT 请求。 S3 能够在几分钟内处理这些负载，但在那之后开始抛出 SlowDown 异常。它使我的服务速度减慢到无法接受的速度。我已阅读 this并实现
amazon-web-services - AWS S3 - 减速 : Please reduce your request rate
SO上有足够多的类似问题和答案。然而很少提到前缀。首先，不再需要前缀的随机化，参见 here This S3 request rate performance increase removes an
html - 如何找到 :hover state using Chrome's inspector 的 CSS 减速
我正在创建以下画廊: gallery 我相信 prettyPhoto.css 在悬停时应用了边框颜色，但我似乎无法使用 Dom Inspector 找到它。谁能帮我找到 css 来编辑鼠标悬停时的边
python - paste.httpserver 并使用 HTTP/1.1 Keep-alive 减速；使用 httperf 和 ab 测试
我有一个基于 paste.httpserver 的网络服务器作为 HTTP 和 WSGI 之间的适配器。当我使用 httperf 进行性能测量时，如果每次使用 --num-conn 启动一个新请求，我

首页

博学

6Ren·AI

商城

theano - 定期记录梯度而不需要 Theano 中的两个函数(或减速)