- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在尝试采用 Adam 的二阶矩项 v_t,并将其用作成本函数中的附加项。我怎样才能实现这样的事情:
Cost = Cross Entropy + v_t*some_function(weights)
这可以在 python 中完成吗?或者我是否必须编写自己的 C++ 代码才能完成此操作?这在像 Keras 这样的框架中也很容易实现吗?这是我试图添加到 keras 中的成本函数的代码:
def my_loss(y_pred, y_true, current_weights, v_t):
normal_loss=K.categorial_cross_entropy(y_pred,y_true)
additional_term=K.dot(K.square(current_weights - K.some_function(current_weights)), v_t)
return normal_loss + additional_term
最佳答案
无论您使用什么框架执行此操作,这都会有问题。具体来说,我们从 ADAM paper相关行:
g_t = d Cost / d weights
v_t = beta2 * v_{t-1} + (1 - beta2) g_t^2
现在,如果您要将 v_t 包含在 Cost 中,这将是一个隐式方程:
g_t = d Cross Entropy / d weights + d (v_t*some_function) / d weights
v_t = beta2 * v_{t-1} + (1 - beta2) g_t^2
注意 v_t 如何出现在两个等式中。我们可以将其扩展为更清晰
v_t = beta2 * v_{t-1} + (1 - beta2) [d Cross Entropy / d weights + d (v_t*some_function) / d weights]^2
您可以尝试精确地解决这个问题,但这样做您将不得不使用某种形式的隐式求解器,这在计算上会非常昂贵。一种方法是 fixed point iteration .
关于python - 使用第二动量作为新成本函数的一部分? (Tensorflow 和/或 keras),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44893395/
如何计算滚动事件的滚动动量? 我知道在结束滚动的开始处必须有两个时间戳。还必须有一个“轴变化”变量,它基本上是无惯性滚动的量。 这是我当前负责结束滚动的代码: if ((type == kMXTEnd
这个问题在这里已经有了答案: How do I give this spaceship acceleration? (3 个答案) 关闭 5 年前。 有一个非常小的类似小行星的游戏片段,我正在使用不
我目前正在试验 THREE.JS 项目,并使用鼠标滚轮滚动事件从 0 转到 1。 但是,我希望实现与您在此链接 playdoh by merci Michael 中看到的相同势头。 目前,这就是我迄今
我正在尝试实现列表对象的动态滚动,但我在根据速度确定要应用的摩擦量(持续时间)时遇到问题。 我的 applyFriction() 方法根据持续时间属性平均降低滚动对象的速度。然而,对每个 Action
几个月来,我一直在努力解决这个问题,并且用尽了我能想到的一切。 我想要实现的是:http://blue.bluestudios.kenzomedia.com/v0.7/ (部分逻辑借鉴了iScroll
我有一个标准的前馈反向传播神经网络,我想训练它来识别蓝色的球。我有 30 张图像,其中 20 张是球的,10 张是没有球的,我的第一个问题是这是否足够,我假设拥有更多比更少更好,但很高兴知道是否有最少
有没有办法在 Google map V3 上禁用拖动惯性?看起来它应该是一个 MapOption,但我找不到任何方法来做到这一点。 最佳答案 我今天遇到了同样的问题,一些自定义 Div 漂浮在 map
当您创建 RMSPRop 优化器时,它会要求提供动量值。这个势头是什么?是内斯特洛夫还是另一个?如何在 tf 中使用 Nesterov 动量和 RMSProp? 这里的文档字符串中有一个公式: htt
我有一个 SGD 求解器: base_lr: 1e-2 lr_policy: "step" gamma: 0.1 stepsize: 10000 max_iter: 300000
我是一名优秀的程序员,十分优秀!