tensorflow2.0 - 是否可以将 Tensorflow Graphics 的 Levenberg-Marquardt 优化器与 Tensorflow 2.0 模型集成？-6ren

tensorflow2.0 - 是否可以将 Tensorflow Graphics 的 Levenberg-Marquardt 优化器与 Tensorflow 2.0 模型集成？

转载作者：行者123 更新时间：2023-12-04 12:00:49

25

4

我有一个 Tensorflow 2.0 tf.keras.Sequential模型。现在，我的技术规范规定使用 Levenberg-Marquardt 优化器来拟合模型。 Tensorflow 2.0 没有将其作为开箱即用的优化器提供，但它在 Tensorflow Graphics 中可用模块。
tfg.math.optimizer.levenberg_marquardt.minimize函数接受 residuals (残差是 Python callable 返回张量)和 variables (对应于我的模型权重的张量列表)作为参数。

将我的模型转换为残差和变量的最佳方法是什么？

如果我理解正确 minimize函数有效，我必须提供两个残差。第一个残差必须为每个学习案例调用我的模型，并将所有结果聚合到一个张量中。第二个残差必须将所有标签作为单个常数张量返回。问题是tf.keras.Sequential.predict函数返回一个 numpy 数组而不是张量。我相信，如果我将其转换为张量，则最小化器将无法计算关于变量的雅可比。

变量也有同样的问题。似乎没有办法将模型中的所有权重提取到张量列表中。

最佳答案

tfg.math.optimizer.levenberg_marquardt.minimize 之间有很大区别和 Keras 优化器从实现/API 的角度来看。
Keras 优化器，例如 tf.keras.optimizers.Adam使用梯度作为输入和更新 tf.Variable s。
相比之下，tfg.math.optimizer.levenberg_marquardt.minimize本质上以图形模式展开优化循环(使用 tf.while_loop 构造)。它采用初始参数值并生成更新的参数值，这与 Adam & co 不同，后者仅应用一次迭代并实际更改 tf.Variable 的值。 s 通过 assign_add .
稍微回到理论大局，Levenberg-Marquardt 不是任何非线性优化问题(例如 Adam)的通用梯度下降式求解器。它专门解决非线性最小二乘优化问题，因此它不是像 Adam 这样的优化器的直接替代品。在梯度下降中，我们计算损失相对于参数的梯度。在 Levenberg-Marquardt 中，我们计算与参数相关的残差的雅可比行列式。具体来说，它反复求解线性化问题Jacobian @ delta_params = residuals为 delta_params使用 tf.linalg.lstsq (内部对从雅可比矩阵计算的 Gram 矩阵使用 Cholesky 分解)并应用 delta_params作为更新。
注意这个lstsq操作在参数数量上具有三次复杂性，因此在神经网络的情况下，它只能应用于相当小的网络。
另请注意，Levenberg-Marquardt 通常用作批处理算法，而不是像 SGD 那样的小批处理算法，尽管没有什么能阻止您在每次迭代中对不同小批处理应用 LM 迭代。
我认为你可能只能从 tfg 的 LM 算法中获得一次迭代，通过类似的方法

from tensorflow_graphics.math.optimizer.levenberg_marquardt import minimize as lm_minimize

for input_batch, target_batch in dataset:

    def residual_fn(trainable_params):
        # do not use trainable params, it will still be at its initial value, since we only do one iteration of Levenberg Marquardt each time.
        return model(input_batch) - target_batch

    new_objective_value, new_params = lm_minimize(residual_fn, model.trainable_variables, max_iter=1)
    for var, new_param in zip(model.trainable_variables, new_params):
        var.assign(new_param)

相比之下，我相信以下幼稚的方法 不能用 我们在计算残差之前分配模型参数:

from tensorflow_graphics.math.optimizer.levenberg_marquardt import minimize as lm_minimize

dataset_iterator = ...

def residual_fn(params):
    input_batch, target_batch = next(dataset_iterator)
    for var, param in zip(model.trainable_variables, params):
        var.assign(param)
    return model(input_batch) - target_batch

final_objective, final_params = lm_minimize(residual_fn, model.trainable_variables, max_iter=10000)
for var, final_param in zip(model.trainable_variables, final_params):
    var.assign(final_param)

主要的概念问题是 residual_fn的输出相对于其输入没有梯度 params ，因为这个依赖通过 tf.assign .但由于使用了图形模式中不允许的构造，它甚至可能在此之前失败。
总的来说，我认为最好编写自己的适用于 tf.Variables 的 LM 优化器。 , 自 tfg.math.optimizer.levenberg_marquardt.minimize有一个非常不同的 API，它并不真正适合优化 Keras 模型参数，因为您无法直接计算 model(input, parameters) - target_value没有 tf.assign .

关于tensorflow2.0 - 是否可以将 Tensorflow Graphics 的 Levenberg-Marquardt 优化器与 Tensorflow 2.0 模型集成？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58564821/

25

4

0

文章推荐： c - 用 C 语言在标准输出中打印新行的最快方法？

文章推荐： layout - Latex 并排两个带标题的逐字环境

文章推荐： reactjs - 在某些函数 **names** 上禁用 max-lines-per-function

c# - Windows 集成 (NTLM) 身份验证与 Windows 集成 (Kerberos)
Windows 集成 (NTLM) 身份验证和 Windows 集成 (Kerberos) 之间有什么区别？如何在IIS6中实现这些 w.r.t. MSDN 最佳答案 Kerberos 和 NTLM
node.js - 无法将 Keycloak 与 Sails 集成。能够将 Keycloak 与 Express 集成
Keycloak是一个用 Java 编写的开源身份验证和身份管理解决方案。它提供了一个nodejs适配器，使用它我能够成功地与express集成。这是有效的路由文件: 'use strict'
Bamboo 集成
这是我关于 Bamboo 的第二个问题 ( My First One )。阅读建议信息后我的理解是，我需要一个构建工具，例如 nAnt 或 MSbuild 来编写一个获取源代码并构建它的脚本(我正在开
JIRA 集成
可用于将第三方应用程序与 jira 4.3 集成的身份验证方案有哪些？显然，从客户那里获取用户名和密码听起来很荒谬。另外，我知道 oauth 身份验证仅适用于版本 5。请告诉我。谢谢。附注。我不是在
JMS/DDS 集成
我有一个使用 DDS 的旧版 C++ 应用程序用于异步通信/消息传递。我需要将此应用程序集成到使用 JMS 进行消息传递的 JavaEE 环境中。除了构建独立的 JMS/DDS 桥接模块之外，我还有其
Clickatell - Whatsapp 集成
我正在尝试使用 Whatsapp 发送测试消息，但收到此错误消息: "error":{"code":27,"description":"Recipient not available on chann
django - 集成 Photologue
我想将 photologue 与我的 Django 应用程序集成，并使用它在车辆库存中显示照片......有点像 Boost Motor Group Inc. 提供的内容。我已经集成了该应用程序，所以
scanning - ScanSnap 集成
我目前正在尝试弄清楚如何与 fujitsu scansnap 扫描仪集成，但没有从 fujitsu 找到有关 fujitsu scansnap 管理器如何调用您的应用程序并将文件发送到您的应用程序的详
Spring 集成 - 多入站适配器不起作用
在我的项目中，我使用了 9 个(九个)int-ip:udp-inbound-channel-adapter 和一个 jms:inbound-channel-adapter。 Jms 适配器从服务器接收
JSF/Applet 集成
在我们当前的原型(prototype)中，大多数标准 HTML 控件都被小程序取代，最重要的是表单提交由小程序触发。有没有一种方法可以像一样在服务器端调用关联的操作 ? 本文Applet and
Twilio whatsapp 集成
是否可以使用 twilio 号码从 whatsapp 发送/接收短信？有人用whatsapp试过twilio吗？我问过客服，如果可能的话，他说，不确定，但很多人都问过这个问题。最佳答案万一其他人来
svn - SVN是否与Notepad++集成？
我们办公室中几乎不存在版本控制，这显然导致了很多麻烦。我们想使用SVN和Notepad++进行设置...任何人都对如何实现此目标有任何想法？我已经开始研究并浏览了这个网站: http://www.sw
Spring-Drools 集成？
曾经有提供这种集成的 spring-modules 项目；但是，该项目现已弃用。现在有没有人继续支持这种集成？谢谢。最佳答案工作正在进行中。 http://blog.athico.com/sear
DBpedia/Yago 集成
我的理解是，根据 http://wiki.dbpedia.org/Datasets，DBpedia 从 YAGO 获取类层次结构，而不是实体。 .但是，类似 http://dbpedia.org/cl
Opencms Spring 集成
任何人都可以帮助我如何将 OpenCMS 与 Java Spring Web 应用程序集成。已经用谷歌搜索并浏览了很多网站但没有用。所以，请帮助我。最佳答案我认为将 SpringMVC 与 Ope
integration - MPGS 集成
我正在尝试使用新的 migs getaway (MPGS) 我遵循了下一个 url 中的代码 https://ap-gateway.mastercard.com/api/documentation/i
TeamCity gitlab 集成
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 4年前关闭。 Improve thi
Vim Cmake 集成
我有一个 cmake 项目。我想轻松完成以下操作搜索光标下任何变量、函数等的声明、定义和引用，这些可能在外部头文件中声明，其路径是在CMakeLists.txt中使用INCLUDE_DIRECTOR
iPhone FTP 集成
有人能给我指点一下 Objective-C(或 c/c++)库的方向，或者教通过 FTP 上传或下载的教程(Objective-C)吗？最好能展示如何将文件下载到临时目录，然后稍后上传？我不介意针对
r - 集成()给出了完全错误的数字
集成()给出了非常错误的答案: integrate(function (x) dnorm(x, -5, 0.07), -Inf, Inf, subdivisions = 10000L) # 2.127

首页

博学

6Ren·AI

商城

tensorflow2.0 - 是否可以将 Tensorflow Graphics 的 Levenberg-Marquardt 优化器与 Tensorflow 2.0 模型集成？