- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用带有 tensorflow 后端的 Keras,我很好奇是否可以在反向传播期间跳过一层但让它在前向传递中执行。这就是我的意思
Lambda (lambda x: a(x))
a
至
x
在前向传递中,但我不希望在反向传播发生时将 a 包含在推导中。
最佳答案
更新 2
除了 tf.py_func
之外,现在还有一个 official guide on how to add a custom op 。
更新
请参阅 this question 以获取纯粹在 Python 中编写具有渐变的自定义操作的示例,而无需重新构建任何内容。请注意,该方法有一些限制(请参阅 tf.py_func
的文档)。
不完全是问题的解决方案,但仍然是一个答案,评论太长了。
这甚至不是 Keras 的问题,而是 TensorFlow 的问题。每个操作都定义了在反向传播期间使用的自己的梯度计算。我你真的想要这样的东西,你需要自己实现 TensorFlow 中的操作(不容易的壮举)并定义你想要的渐变 - 因为你不能有“没有渐变”,如果有的话,它会是 1 或0(否则你不能继续反向传播)。 TensorFlow 中有一个 tf.NoGradient
函数,它会导致操作传播零,但我不认为它意味着/可以在 TensorFlow 自己的内部结构之外使用。
更新
好的,更多的上下文。 TensorFlow 图由 ops 构建,由内核实现;这基本上是一个 1 对 1 的映射,除了一个操作可能有一个 CPU 和一个 GPU 内核,因此有区别。 TensorFlow 支持的操作集通常是静态的,我的意思是它可以随着更新的版本而改变,但原则上你不能添加自己的操作,因为图形的操作进入 Protobuf 序列化格式,所以如果你自己制作操作那么您将无法共享您的图表。然后在 C++ 级别使用宏 REGISTER_OP
定义操作(例如参见 here ),使用 REGISTER_KERNEL_BUILDER
定义内核(例如参见 here )。
现在,渐变在哪里发挥作用?好吧,有趣的是操作的梯度不是在 C++ 级别定义的;有些操作(和内核)实现了其他操作的渐变(如果您查看以前的文件,您会发现名称以 Grad
结尾的操作/内核),但是(据我所知)这些不是在此级别上明确“链接”。似乎操作与其梯度之间的关联是在 Python 中定义的,通常通过 tf.RegisterGradient
或前面提到的 tf.NoGradient
(参见例如 here ,以 gen_
开头的 Python 模块是在 C++ 宏的帮助下自动生成的);这些注册告知反向传播算法如何计算图的梯度。
那么,如何实际解决这个问题呢?好吧,您需要在 C++ 中创建至少一个操作,并使用相应的内核实现您想要用于前向传递的计算。然后,如果您想要使用的梯度计算可以用现有的 TensorFlow 操作(最有可能)表示,您只需要在 Python 中调用 tf.RegisterGradient
并在“标准”TensorFlow 中进行计算。这很复杂,但好消息是它是可能的,甚至还有一个 example (尽管我认为他们有点忘记了梯度注册部分)!正如您将看到的,该过程涉及将新的操作代码编译到一个库中(顺便说一句,我不确定这是否可以在 Windows 上运行),然后从 Python 加载(显然这涉及经历 manual compilation of TensorFlow 的痛苦过程) Bazel)。一个可能更现实的例子可以在 TensorFlow Fold 中找到,它是结构化数据的 TensorFlow 扩展,它通过调用 REGISTER_OP
的宏定义的 here 注册(作为一个)一个自定义操作 here ,然后在 Python 中加载库并注册其梯度here 通过自己定义的注册函数 here 简单地调用 tf.NotDifferentiable
( tf.NoGradient
的另一个名字)
tldr:这相当困难,但可以做到,甚至有几个例子。
关于tensorflow - 在keras的反向传播中跳过层,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43277461/
我的算法- private static MyList skip$DeleteItem(MyList L , int M , int N){ MyList curr = L; MyLi
我正在 SWI-Prolog 下开发,但我的目标是 Erlog (https://github.com/rvirding/erlog)。我需要一种使用非标准 Prolog 语法的方法。 有没有办法
我正在尝试从应用程序下载一大堆文件。它的shell命令是“下载文件名”。 我有一个文本文件,其中包含必须下载的所有文件名。我要做的就是运行一个脚本/命令,以便在执行上述命令时 1.从文本文件中提取文件
我试图循环遍历所有用户的评论,但使用 if 语句查找特定值。问题是我的应用程序崩溃了,因为一些用户没有发表评论,因此我得到“无法读取‘收集’未定义的属性”。如何跳过 if 语句的未定义值?代码如下:
我们有按年份分区的索引,例如: items-2019 items-2020 考虑以下数据: POST items-2019/_doc { "@timestamp": "2019-01-01" }
我只是编写一个页面来按实体编号查看每个 ASCII 条目,我想知道是否有一种更简单/更干净的方法来跳过不需要的数字。 var x = new Ar
我希望能够普遍使用重复条目,但也能够跳过特定日期。例子: ** TODO swim practice SCHEDULED 但是,我提前知道 2013-12-25 不会有练习。但是,当我将项目标
如何跳过像这样的 for 循环的一次迭代: for (int i = 65; i <= 90; i++) { if (!(i == 73)) { uniq.add((char) i);
这个问题已经存在: Scanner issue when using nextLine after nextXXX [duplicate] 已关闭 9 年前。 ask=1; while(ask==1)
我在使用一个程序时遇到了一些麻烦,我应该允许用户在程序中输入任意数量的数字,直到他们不再想要为止。然后程序应该计算输入数字的平均值和最大值。我哪里做错了? import java.util.Scann
我有一个名为segments的 Sprite 数组,我想在每个循环中跳过segments的第一个元素。我目前正在这样做: var first = true; for each (var segment
我目前正在编写一个 for 循环来遍历包含 38 个元素的 2D。然而,其中一些元素为空,我希望 for 循环简单地跳过它们(因为在我正在解决的难题中,它们没有与它们相关的移动)。快速搜索表明,我可以
我想使用pre-commit处理我的 git 项目的 git hooks。但是,当我使用它时,git commit 命令不断跳过 unittest 执行: (smartexchange) trnboo
这个问题在这里已经有了答案: Does scanf() take '\n' as input leftover from previous scanf()? (1 个回答) 关闭 9 年前。 我正在
我正在迭代 csv 文件中的每一行,并仅选择/计算满足条件的行。但是,当连续出现错误时,它会停止循环。有没有办法告诉 python 跳过错误并移动到下一行?我使用了 try 函数但没有工作。我的代码是
感谢您提供的优秀示例,我试过了,它按我的预期工作。很高兴看到有人了解问题的本质。但是,我认为我应该用 Lift 标记问题,因为我正在使用 Lift 框架,这就是(仍然)发生这个问题的地方(尽管我仍然认
大家好,我正在编写一个算法来从 NodeTree 中删除具体分支(例如 DSF)。如果您选择 Node 的名称,算法将检查该 Node 是否是其他 Node 的父 Node ;如果是,它会获取该 No
附有代码和输出。 基本上它是第二次跳过我的输入。就像我启动代码一样,它让我输入一个选项,然后第二次跳过输入,直接转到开关的默认情况。 然后第三次它就会允许我输入。不明白为什么。 任何帮助将不胜感激。
我在 JavaScript 中有一个 for 循环,它会定期跳过间隔,但我无法确定原因。 console.log(parseInt($('input.num-to-add').val())); num
我正在 JasperSoft 中填写参数。在我的报告中我有参数:参数_1、参数_2、参数_3 int a; for (a = 0; a < headers.length; a++) {
我是一名优秀的程序员,十分优秀!