- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试使用 tf.RegisterGradient
和 tf.gradient_override_map
编辑 tf.stack
op 的反向梯度计算机制,这是我的代码:
import tensorflow as tf
class SynthGradBuilder(object):
def __init__(self):
self.num_calls = 0
def __call__(self, x, l=1.0):
op_name = "SynthGrad%d" % self.num_calls
@tf.RegisterGradient(op_name)
def _grad_synth(op, grad):
return grad[0]
g = tf.get_default_graph()
with g.gradient_override_map({"stack": op_name}):
y = tf.stack([x,x])
self.num_calls += 1
return y
GradSys = SynthGradBuilder()
在另一个脚本中,我写了
import tensorflow as tf
from gradient_synthesizer import GradSys
x = tf.Variable([1,2])
y = GradSys(x, l=1)
z = tf.stack([x,x])
grad = tf.gradients(y, x, grad_ys=[[tf.convert_to_tensor([3, 4]),
tf.convert_to_tensor([6, 8])]])
grad_stack = tf.gradients(z, x, grad_ys=[[tf.convert_to_tensor([3, 4]),
tf.convert_to_tensor([6, 8])]])
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
print "grad bp: ", sess.run(grad)
print "grad_stack: ", sess.run(grad_stack)
print "y: ", sess.run(y)
预期的输出应该是:
grad bp: [3,4];
grad_stack: [3+6, 4+8] = [9, 12];
y: [[1,2], [1,2]];
我从代码中实际得到的是:
表明 tf.stack
的反向梯度根本没有被替换,这与我的预期相反。
我不确定这种差异是不是错误地使用“stack”作为操作tf.stack
的类型串造成的,我做了如下实验:
描述张量y的第一项,“stack:0”暗示op tf.stack
的注册名是“stack”,也是它的类型string。所以看起来这不是“堆栈”的错。
我无法找出代码问题的原因。我想知道是否有人可以帮助我。
最佳答案
Tl;dr:正确的代码应该是:
@tf.RegisterGradient(op_name)
def _grad_synth(op, grad):
x, y = tf.unstack(grad)
return [x, tf.zeros_like(y)]
g = tf.get_default_graph()
with g.gradient_override_map({"Pack": op_name}):
y = tf.stack([x, x])
因为这是一个很常见的问题,所以我想解释一下更多细节:
您的原始代码中存在两个主要问题:
gradient_override_map
的错误用法:tf.stack
的实际 OP 名称是 Pack
(不是 Stack
),因此您需要覆盖 Pack
而不是 Stack
:
`g.gradient_override_map({"Pack": op_name})`.
您可能想知道我怎么知道实际的 OP 名称?好吧,一个简单的方法是通过运行以下代码来探测 GraphDef:
with tf.Graph().as_default():
x = tf.constant(0)
y = tf.stack([x, x])
print(tf.get_default_graph().as_graph_def())
Pack
的原始渐变是一个简单的Unpack
( official code )。在你的情况下,你仍然需要先解压梯度,但只传播第一部分:
@tf.RegisterGradient(op_name)
def _grad_synth(op, grad):
x, y = tf.unstack(grad)
return [x, tf.zeros_like(y)]
请注意,此代码非常适合您的情况。然而,如果你想支持任意长度的堆栈,你可以使用稍微复杂一点的版本:
@tf.RegisterGradient(op_name)
def _grad_synth(op, grad):
x_list = tf.unstack(grad)
for i in range(1, len(x_list)):
x_list[i] = tf.zeros_like(x_list[i])
return x_list
关于python - Tensorflow:gradient_override_map 无法覆盖 op tf.stack 的反向梯度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47013530/
我知道 C++ 中的 overriding 是什么。但是,是否存在覆盖?如果有,是什么意思? 谢谢。 最佳答案 在 C++ 术语中,您有 覆盖(与类层次结构中的虚拟方法相关)和 重载(与具有相同名称但
我想捕获位于另一个元素下的元素的鼠标事件。 这是我所拥有的示例:http://jsfiddle.net/KVLkp/13/ 现在我想要的是当鼠标悬停在红色方 block 上时蓝色方 block 有黄色
以下报道 here我尝试创建一个带有重叠散点图的箱线图。 但是当我运行时: In [27]: table1.t_in[table1.duration==6] Out[27]: counter 7
有一个 JS Fiddle here , 你能在不克隆到新对象的情况下替换 e.target 吗? 下面重复了那个 fiddle 的听众; one.addEventListener('click',
首先要解决重复的可能性: 我不是询问 Override 是什么、它的含义或 @Override 在 java 文档注释之外。那是我不是问 /**Some JavaDoc Comment*/ @over
我想要高于定义的数组。它存储点及其坐标。 public static List simpleGraph(List nodes) { int numEdges = nodes.size() *
我在 http://olisan.dk/blog/ 有一个博客- 如您所见,有一个 28 像素的高间隙(边距顶部)...在 style.css 中: margin-top: 0; 也被设置为 marg
Vulkan 句柄是指向 struct 的不透明指针,或者只是无符号的 64 位整数,具体取决于 VK_USE_64_BIT_PTR_DEFINES 的值: #if (VK_USE_64_BI
我正在尝试提供一个行为类似于 DataGridTextColumn 的 DataGrid 列,但在编辑模式下有一个附加按钮。我查看了 DataGridTemplateColumn,但似乎更容易将 Da
使用 Django 1.10 我想在用户名中允许\字符,因为我在使用“django.contrib.auth.middleware.RemoteUserMiddleware”的 Windows 环境中
我正在尝试使用 ffmpeg 将 Logo 放入 rtmp 流中。我的 ffmpeg 版本是 ffmpeg version 4.3.1目前在我的复杂过滤器中,我有: ffmpeg -re -i 'v
是否有用于Firebase 3存储的方法/规则来禁用文件更新或覆盖? 我为数据库找到了data.exists(),但没有为存储找到解决方案。 最佳答案 TL; DR:在Storage Security
我有两个 Docker Compose 文件,docker-compose.yml看起来像这样 version: '2' services: mongo: image: mongo:3.2
我需要覆盖 JPA 中的集合表吗?也许有人有想法 public class nationality{ @Embedded @AttributeOverrides({
嗨,我正在使用 WIX 和下面的代码将文件安装到目录中。 我的应用程序的工作方式是用户可以在该目录中复制他们自己的文件,覆盖他们喜欢的内容
我正在尝试为 Lua 中的字符串实现我自己的长度方法。 我已成功覆盖字符串的 len() 方法,但我不知道如何为 # 运算符执行此操作。 orig_len = string.len function
在Scala 2.10.4中,给出以下类: scala> class Foo { | val x = true | val f = if (x) 100 else 200
我想做上面的事情。 我过去覆盖了许多文件...... block ,模型,助手......但这个让我望而却步。 谁能看到我在这里做错了什么: (我编辑了这段代码......现在包括一些建议......
根据javadoc An instance method in a subclass with the same signature (name, plus the number and the ty
我有一段代码,只要有可用的新数据作为 InputStream 就会生成新数据。每次都覆盖同一个文件。有时文件在写入之前变为 0 kb。 Web 服务会定期读取这些文件。我需要避免文件为 0 字节的情况
我是一名优秀的程序员,十分优秀!