tensorflow - 最小化 tensorflow 中复值网络的损失-6ren

tensorflow - 最小化 tensorflow 中复值网络的损失

转载作者：行者123 更新时间：2023-12-04 03:12:30

31

4

目前，我正在尝试训练一个同时具有复值张量作为输入和输出的网络。作为损失函数，我采用输出与真实值之间逐点差异的范数。
当我尝试最小化损失函数时，tensorflow 的“最小化”函数提示意外的复数。我觉得这很奇怪，因为我希望 tensorflow 能够处理复数的反向传播。此外，我明确检查了损失值确实是一个实值张量。
我被卡住的原因是错误发生在 tensorflows 代码深处并且似乎是基于梯度的类型。在这里，我发现很难看出幕后到底发生了什么以及这些梯度计算应该如何发生。谁能帮我弄清楚应该如何使用 tensorflow 训练复杂网络？

这是一个最小的独立代码示例。它只有一个复杂的全连接层，包含最小化函数之前的所有代码，在它下面是我得到的相应错误消息:

import tensorflow as tf

def do_training():
    # Create placeholders for potential training-data/labels
    train_data_node = tf.placeholder(tf.complex64,
                                     shape=(25, 10),
                                     name="train_data_node")

    train_labels_node = tf.placeholder(tf.complex64,
                                       shape=(25, 10),
                                       name="train_labels_node")

    # create and initialise the weights
    weights = {
        'fc_w1': tf.Variable(tf.complex( tf.random_normal([10, 10], stddev=0.01, dtype =  tf.float32),
                                         tf.random_normal([10, 10], stddev=0.01, dtype =  tf.float32))),
        'fc_b1': tf.Variable(tf.complex( tf.random_normal([10]), tf.random_normal([10]))),
        }

    prediction = model(train_data_node, weights)
    loss = tf.real(tf.norm(prediction - train_labels_node))

    train_op = tf.train.AdamOptimizer(learning_rate=1.0).minimize(loss)

def model(data, weights):
    l1 = tf.matmul(data, weights['fc_w1'])                                                        # FC
    l1 = l1 + weights['fc_b1']
    return l1

错误信息:

Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/usr/local/lib/python2.7/dist-packages/myFolder/training.py", line 23, in do_training
train_op = tf.train.AdamOptimizer(learning_rate=1.0).minimize(loss)
File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/training/optimizer.py", line 315, in minimize
grad_loss=grad_loss)
File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/training/optimizer.py", line 392, in compute_gradients
if g is not None and v.dtype != dtypes.resource])
File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/training/optimizer.py", line 517, in _assert_valid_dtypes
dtype, t.name, [v for v in valid_dtypes]))
ValueError: Invalid type tf.complex64 for Variable:0, expected: [tf.float32, tf.float64, tf.float16].

编辑:我尝试用实值权重替换复杂的权重。这需要先将这些权重转换为复数值，然后再将它们乘以全连接层。这行得通，所以我目前的假设是 tensorflow 不支持复杂权重的梯度计算。谁能证实这一点？

最佳答案

您已经从错误中得到确认。同样来自 source code _assert_valid_dtypes 使用的函数

  def _valid_dtypes(self):
    """Valid types for loss, variables and gradients.
    Subclasses should override to allow other float types.
    Returns:
      Valid types for loss, variables and gradients.
    """
    return set([dtypes.float16, dtypes.float32, dtypes.float64])

这正是错误告诉您的内容。

这不是 TF 无法正确处理复数值的唯一地方。甚至像 tf.reduce_prod 这样的计算也有问题。

关于tensorflow - 最小化 tensorflow 中复值网络的损失，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43934487/

31

4

0

文章推荐： angular - 将对象插入数组并 *ngFor 它

文章推荐： java - JPA 在使用 selectcase 构造查询时处理空值

文章推荐： php - Composer : replace dependencies with local versions

regex - DFA 最小化
我有一个关于 DFA 最小化的问题。所以我使用了众所周知的技术将正则表达式转换为 NFA，然后使用 goto/closure 算法从中构造 DFA。现在的问题是如何将其最小化？我在这里看过有关它的课文
delphi - 最小化/优化重复代码
这是我的代码，当鼠标光标悬停在 TPanel 上时，它会“动画化”它。我还有一个代码块来取消它的动画。 procedure Tmain.pStarting1MouseEnter(Sender: TOb
Jquery setInterval 最小化
我有图像 slider ，其中图像在超时时相互替换。我使用 jQuery 函数 setInterval() 但有一个小问题，在最小化浏览器窗口后，该函数继续“工作”，并且我恢复浏览器窗口图像的位置以令
c# - 禁用窗体双击时的最大化/最小化
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: How can I stop a double click of the window title bar
c# - 最小化/恢复窗口时是否可以禁用动画？
当我在我的 Windows 窗体应用程序中单击最小化按钮时，我不希望它执行经典的 Windows 最小化动画(窗口下降到任务栏)。据我所知，没有最小化事件，我只能使用调整大小，但我不知道如何检测我是
android - 检测应用程序关闭/最小化
首先 - 对不起我的英语。我刚刚创建了 Android 应用程序。它包含几个 Activity ，并在此应用程序的背景下播放音乐。当用户以某种方式(通过单击“后退”按钮、主页按钮或其他方式)离开应用
Java 2D 最小化
我需要帮助编写一个程序，该程序以 (X,Y) 的形式给出指定数量的坐标点。将给出的点数是程序中的第一行；它可以通过扫描仪读取。我需要计算覆盖线 x = a 和 y = b 的所有点的最小面积。因此，
Android:最小化 Activity
我需要一个 Activity 返回到上一个 Activity ，但如果再次单击该按钮，它将恢复上次的 Activity 。这是所需的过程:我点击一个按钮， Activity 开始。如果我点击“后退”按
javascript - 函数参数列表太长 |最小化
随着这个动画变得越来越复杂，我不断添加参数，以便它们在每次回调时可用。目前共有 6 个。例如，现在我想在显示消息时禁用输入框，因此我必须添加另一个元素 - in_element; 电话: M
c++ - 最小化、最大化按钮无缘无故消失
这是一个基于对话框的 MFC 应用程序。我并没有故意添加任何关于最小化、最大化和恢复按钮的代码。它可以首先显示那些按钮。但它在长时间运行后就会消失。或者计算机的 sleep 可能导致此问题？我不知道
c++ - 禁用窗口最大化/最小化
如何使用 Windows API 禁用窗口的最大化和/或最小化功能？最大化/最小化框需要变灰并禁用，双击标题栏、拖动到屏幕顶部等也需要不起作用。最佳答案您可以调用 SetWindowLong/Se
最小化 session 日程冲突的算法
是否有任何已知的算法帽子可以解决以下问题:我们有一个 session ，有多个同时会谈。用户应标记感兴趣的会谈，然后我们要创建一个会谈时间表，以便我的大多数人都可以参加他们的会谈并最大限度地减少日程冲
c++ - 什么事件用于最大化/最小化？
目前我负责为一个小项目开发一个(C++)窗口类；目标是将依赖性保持在最低限度。Win32/WinAPI 的实现按预期工作，但是，当涉及到 Linux/XCB 时，我正在努力。我知道，我可以检查“_N
c++ - windows编程中如何触发最大化/最小化
windows C++编程，如何让事件窗口最大化或最小化？对于鼠标按下事件，我们使用类似 mi.dwFlags = MOUSEEVENTF_LEFTDOWN 的东西，并使用 SendInput()
java - 最小化 if 条件
我编写了以下获取 2 个参数的构造函数，如果值(x 或 y)为负，它将被初始化为零。 public Point1 ( int x , int y ) { //if one or
javascript - 最小化 puppeteer 时我的代码不运行
我有以下代码，如果我将导航窗口最大化，它运行良好，但是当我最小化它时它停止工作。更多细节: 当窗口最小化时，“scrollDown & scrollTop”函数停止执行。 'use strict'
vba - 始终保持 Excel 最小化
我有一个包含一些宏和用户表单的 Excel 文件。我不希望用户在没有密码的情况下访问文件本身。他们应该只能看到用户表单并通过用户表单输入数据。这是我目前拥有的代码。 Private Sub Wor
tensorflow - 最小化 tensorflow 中复值网络的损失
目前，我正在尝试训练一个同时具有复值张量作为输入和输出的网络。作为损失函数，我采用输出与真实值之间逐点差异的范数。当我尝试最小化损失函数时，tensorflow 的“最小化”函数提示意外的复数。我觉
memory - 最小化 Julia 函数中的内存使用
这个函数是我想要优化的主力。任何关于如何限制其内存使用的想法都会很棒。 function F(len, rNo, n, ratio = 0.5) s = zeros(len); m = co
qt - 最小化 Qt 应用程序
在 Qt 下的 Windows Mobile 和 Symbian 平台上，如何通过单击应用程序中的某个按钮来最小化我的应用程序？最佳答案大概QWidget::setWindowState将适合您，

首页

博学

6Ren·AI

商城

tensorflow - 最小化 tensorflow 中复值网络的损失