python - 输入张量 <name> 进入循环，形状为 ()，但在一次迭代后形状为 <unknown>-6ren

python - 输入张量进入循环，形状为 ()，但在一次迭代后形状为

转载作者：行者123 更新时间：2023-12-05 06:10:49

我正在尝试使用 tf.function 保存模型在贪婪解码方法上。

代码已经过测试，并且按预期在急切模式(调试)下工作。但是，它在非急切执行中不起作用。

该方法得到一个 namedtuple称为 Hyp看起来像这样:

Hyp = namedtuple(
    'Hyp',
    field_names='score, yseq, encoder_state, decoder_state, decoder_output'
)

while 循环是这样调用的:

_, hyp = tf.while_loop(
    cond=condition_,
    body=body_,
    loop_vars=(tf.constant(0, dtype=tf.int32), hyp),
    shape_invariants=(
        tf.TensorShape([]),
        tf.nest.map_structure(get_shape_invariants, hyp),
    )
)

这是 body_ 的相关部分:

def body_(i_, hypothesis_: Hyp):

    # [:] Collapsed some code ..

    def update_from_next_id_():
        return Hyp(
            # Update values ..
        )

    # The only place where I generate a new hypothesis_ namedtuple
    hypothesis_ = tf.cond(
        tf.not_equal(next_id, blank),
        true_fn=lambda: update_from_next_id_(),
        false_fn=lambda: hypothesis_
    )

    return i_ + 1, hypothesis_

我得到的是 ValueError :

ValueError: Input tensor 'hypotheses:0' enters the loop with shape (), but has shape <unknown> after one iteration. To allow the shape to vary across iterations, use the shape_invariants argument of tf.while_loop to specify a less-specific shape.

这可能是什么问题？

下面是如何input_signature为 tf.function 定义我想连载。

在这里，self.greedy_decode_impl是实际的实现 - 我知道这有点难看但是 self.greedy_decode这就是我所说的。

self.greedy_decode = tf.function(
    self.greedy_decode_impl,
    input_signature=(
        tf.TensorSpec([1, None, self.config.encoder.lstm_units], dtype=tf.float32),
        Hyp(
            score=tf.TensorSpec([], dtype=tf.float32),
            yseq=tf.TensorSpec([1, None], dtype=tf.int32),
            encoder_state=tuple(
                (tf.TensorSpec([1, lstm.units], dtype=tf.float32),
                 tf.TensorSpec([1, lstm.units], dtype=tf.float32))
                for (lstm, _) in self.encoder_network.lstm_stack
            ),
            decoder_state=tuple(
                (tf.TensorSpec([1, lstm.units], dtype=tf.float32),
                 tf.TensorSpec([1, lstm.units], dtype=tf.float32))
                for (lstm, _) in self.predict_network.lstm_stack
            ),
            decoder_output=tf.TensorSpec([1, None, self.config.decoder.lstm_units], dtype=tf.float32)
        ),
    )
)

执行greedy_decode_impl :

def greedy_decode_impl(self, encoder_outputs: tf.Tensor, hypotheses: Hyp, blank=0) -> Hyp:

    hyp = hypotheses

    encoder_outputs = encoder_outputs[0]

    def condition_(i_, *_):
        time_steps = tf.shape(encoder_outputs)[0]
        return tf.less(i_, time_steps)

    def body_(i_, hypothesis_: Hyp):

        encoder_output_ = tf.reshape(encoder_outputs[i_], shape=(1, 1, -1))

        join_out = self.join_network((encoder_output_, hypothesis_.decoder_output), training=False)

        logits = tf.squeeze(tf.nn.log_softmax(tf.squeeze(join_out)))
        next_id = tf.argmax(logits, output_type=tf.int32)
        log_prob = logits[next_id]
        next_id = tf.reshape(next_id, (1, 1))

        def update_from_next_id_():
            decoder_output_, decoder_state_ = self.predict_network(
                next_id,
                memory_states=hypothesis_.decoder_state,
                training=False
            )
            return Hyp(
                score=hypothesis_.score + log_prob,
                yseq=tf.concat([hypothesis_.yseq, next_id], axis=0),
                decoder_state=decoder_state_,
                decoder_output=decoder_output_,
                encoder_state=hypothesis_.encoder_state
            )

        hypothesis_ = tf.cond(
            tf.not_equal(next_id, blank),
            true_fn=lambda: update_from_next_id_(),
            false_fn=lambda: hypothesis_
        )

        return i_ + 1, hypothesis_

    _, hyp = tf.while_loop(
        cond=condition_,
        body=body_,
        loop_vars=(tf.constant(0, dtype=tf.int32), hyp),
        shape_invariants=(
            tf.TensorShape([]),
            tf.nest.map_structure(get_shape_invariants, hyp),
        )
    )

    return hyp

为什么它在 eager-mode 下工作而不在 non-eager 模式下工作？

根据 tf.while_loop 的文档一个namedtuple应该没问题。

斐波那契例子

为了检查这是否适用于 namedtuple ，我已经使用类似的机制实现了斐波那契数列。为了包含条件，循环在到达步骤 n // 2 时停止附加新数字。 :

正如我们在下面看到的，该方法应该可以在没有 Python 副作用的情况下工作。

from collections import namedtuple

import tensorflow as tf

FibonacciStep = namedtuple('FibonacciStep', field_names='seq, prev_value')


def shape_list(x):
    static = x.shape.as_list()
    dynamic = tf.shape(x)
    return [dynamic[i] if s is None else s for i, s in enumerate(static)]


def get_shape_invariants(tensor):
    shapes = shape_list(tensor)
    return tf.TensorShape([i if isinstance(i, int) else None for i in shapes])


def save_tflite(fp, concrete_fn):
    converter = tf.lite.TFLiteConverter.from_concrete_functions([concrete_fn])
    converter.experimental_new_converter = True
    converter.target_spec.supported_ops = [tf.lite.OpsSet.TFLITE_BUILTINS, tf.lite.OpsSet.SELECT_TF_OPS]
    converter.optimizations = []
    tflite_model = converter.convert()
    with tf.io.gfile.GFile(fp, 'wb') as f:
        f.write(tflite_model)


@tf.function(
    input_signature=(
        tf.TensorSpec([], dtype=tf.int32),
        FibonacciStep(
            seq=tf.TensorSpec([1, None], dtype=tf.int32),
            prev_value=tf.TensorSpec([], dtype=tf.int32),
        )
    )
)
def fibonacci(n: tf.Tensor, fibo: FibonacciStep):

    def cond_(i_, *args):
        return tf.less(i_, n)

    def body_(i_, fibo_: FibonacciStep):

        prev_value = fibo_.seq[0, -1] + fibo_.prev_value

        def append_value():
            return FibonacciStep(
                seq=tf.concat([fibo_.seq, tf.reshape(prev_value, shape=(1, 1))], axis=-1),
                prev_value=fibo_.seq[0, -1]
            )

        fibo_ = tf.cond(
            tf.less_equal(i_, n // 2),
            true_fn=lambda: append_value(),
            false_fn=lambda: fibo_
        )

        return i_ + 1, fibo_

    _, fibo = tf.while_loop(
        cond=cond_,
        body=body_,
        loop_vars=(0, fibo),
        shape_invariants=(
            tf.TensorShape([]),
            tf.nest.map_structure(get_shape_invariants, fibo),
        )
    )

    return fibo


def main():

    n = tf.constant(10, dtype=tf.int32)
    fibo = FibonacciStep(
        seq=tf.constant([[0, 1]], dtype=tf.int32),
        prev_value=tf.constant(0, dtype=tf.int32),
    )

    fibo = fibonacci(n, fibo=fibo)
    fibo = fibonacci(n + 10, fibo=fibo)

    fp = '/tmp/fibonacci.tflite'
    concrete_fn = fibonacci.get_concrete_function()
    save_tflite(fp, concrete_fn)

    print(fibo.seq.numpy()[0].tolist())

    print('All done.')


if __name__ == '__main__':
    main()

输出:

[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584]
All done.

最佳答案

好吧，原来是这样

tf.concat([hypothesis_.yseq, next_id], axis=0),

应该是

tf.concat([hypothesis_.yseq, next_id], axis=-1),

公平地说，错误消息有点给了您在哪里查看的提示，但用“有帮助”来形容它太过分了。我通过连接错误的轴违反了 TensorSpec，仅此而已，但 Tensorflow 无法直接指向受影响的 Tensor(目前)。

关于python - 输入张量 <name> 进入循环，形状为 ()，但在一次迭代后形状为 <unknown>，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64244431/

文章推荐： reactjs - i18next-xhr-backend 获取数据失败 React-Native

文章推荐： flutter |我如何记录用户在我的应用程序中花费的时间？

c++ - 为什么我可以 mov 进入 eax，进入 ax，但不能进入 al，甚至可能进入 ah？
如果我 mov, eax 12345 和之后的 mov var, eax (假设 var 是一个 32 位的 int 等..等等)并输出 var 稍后它会正确输出。与 ax 相同。 mov ax,
php - if 进入 for 时的奇怪行为
我有这个代码: for($nrt=0; $nrt"; if($sidesIndexes[$nrt]==$nrt) { echo "am I in??? ".$sidesInde
进入 channel 无限循环不阻塞
我正在阅读The Go Programming Language的8.5章，并陷入一些代码。下面的代码列表。 func main() { naturals := make(chan int)
MYSQL 进入 OUTFILE
我写了一个 MySQL 查询用于将数据导出到文本文件。查询运行成功，但结果与我的预期不符。我想在列之间没有间距的结果。 select sample_export_record1_2013.
excel - 进入 ThisWorkbook 代码区
在普通的 Excel 窗口中，我可以打开 VBE 并通过触摸键序列插入一个新模块:ALT+F11、ALTim 全部不使用鼠标。有没有办法打开 VBE 并导航到本工作手册不使用鼠标的代码区域？最佳
reactjs - Axios 进入 .then 未按预期工作
我正在使用 axios 发出 http 请求。在 .then() 内部，我正在使用另一个 axios 调用。最后，我有第三个 then()，它应该在第二个 then 之后运行，但实际上并没有这样做。
iphone - MPMoviePlayerController 进入 View
我需要在 cocos2d 项目中播放视频..我的问题是:如何将 MPMoviePlayerController 放入我的 View 中，如下所示:？ UIView *theView = [[CCDir
javascript - Angular 进入 Controller
我正在学习 Angular。以下代码有效: .controller('abc', function ($scope, $http) { $http.get("/Handlers/Authenticat
c# - ViewModel 进入 View
目前我正在使用 WPF 学习 C#。我的主要方法是尽我所能使用 MVVM 模式，但现在我有点困惑。在我所有 View 的应用程序中，我有一个 View 模型: private DruckviewVi
javascript - IF 进入 Google 脚本中关于提取电子邮件的循环
关于将 G 邮件提取到 Google 电子表格，我该如何添加 IF 以按主题驳回特定电子邮件？例如:电子邮件回复(主题中带有“RE:”)。我不希望这些电子邮件出现在我的电子表格中。我尝试过使用 LO
javascript - 进入 Spotify 阵列
我正在尝试使用 Spotify API 并进入数组。 const App = () => { const [isLoading, setIsLoading] = useState(true);
symfony - 如何使用条件 if 进入 assetic
我有一个 html 模板，并且有一个条件为 --> 的代码 --> window.jQuery || document.write(""+"");
java - 进入 UI 线程
我正在开发一个 Android 应用程序，该应用程序会暴力破解从 int 创建的 MD5 和。暴力破解部分工作正常。 (我可以sysout最终值并且它是正确的。) 我在将输出值发送到警报对话框时遇到
jquery - D3 进入/退出路径圆组
我正在创建一个界面，用户可以通过该界面生成多系列折线图，并控制绘制哪些数据集。要绘制哪些数据集由复选框控制。页面加载时，默认数据集以图表形式呈现，并且 $('input:checkbox.data-
javascript - 进入/退出未正确清理强制布局中弹出的节点/链接
我尝试将有向无环图绘制为力布局。但是我注意到，尽管为每个组元素灌输了进入/退出条件，弹出的节点/链接并没有从 DOM 中删除它们自己。相反，弹出的节点/链接在力布局中卡住；这意味着没有调用进入/退
c# - 调试问题 - 进入 - C#
这里是新手。我不知道它是怎么发生的，但我正在处理一个程序，当我去调试并进入时，黄色箭头走到了我代码的最后并跳过了整个 block 。有快速解决方法吗？最佳答案按 F11，或单击工具栏上的“Step
android - 进入 ListNavigation 单击操作栏中的
我的 Action 栏 sherlock 中有一个列表。我想在用户点击该列表时得到。我不想知道用户何时点击某个项目，我已经知道 (onNavigationItemSelected)。在我的 onCr
MySQL 日期 -> 进入 EuroDate
** 你好 **我如何从 ci 中的 mysql 日期获取 eurodate 来工作......无法弄清楚 - 请帮忙想要获取日期 YY-mm- dd -> dd-mm-yy提前致谢最佳答案 $t
bash - cd 进入 while 循环中的目录不起作用
我有以下脚本: #!/bin/bash ls -1 | while read d do [[ -f "$d" ]] && continue echo $d cd $d done
c# - 进入/退出方法时如何增加/减少缩进？
TL;DR - 跳转到最后一段背景我正在执行一些数据驱动测试，并将日志文件用作测试输出之一。它的工作原理是这样的- 读取文件夹中的第一个文件处理第一行并转换为测试运行测试执行验证 1 ...

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 输入张量进入循环，形状为 ()，但在一次迭代后形状为

斐波那契例子

首页

博学

6Ren·AI

商城

python - 输入张量 进入循环，形状为 ()，但在一次迭代后形状为

斐波那契例子

python - 输入张量进入循环，形状为 ()，但在一次迭代后形状为