gpt4 book ai didi

TensorFlow LSTM 生成模型

转载 作者:行者123 更新时间:2023-12-04 23:42:10 24 4
gpt4 key购买 nike

我正在学习 LSTM 语言模型教程 discussed here .

对于语言模型,通常使用模型在训练后从头开始生成新句子(即来自模型的样本)。

我是 TensorFlow 的新手,但我正在尝试使用我训练有素的模型来生成新词,直到句尾标记为止。

我的初步尝试:

x = tf.zeros_like(m.input_data)
state = m.initial_state.eval()
for step in xrange(m.num_steps):
state = session.run(m.final_state,
{m.input_data: x,
m.initial_state: state})
x = state

它失败并出现错误:

ValueError: setting an array element with a sequence.

最佳答案

这里的问题似乎是 m.input_data: x feed_dict 中的映射已通过 session.run() .在这种情况下,TensorFlow 预计 x是一个 numpy 数组(或一些可以隐式转换为 numpy 数组的对象),但值是一个 TensorFlow Tensor ( tf.zeros_like() 的结果)。

幸运的是,解决方案很简单。替换 x = tf.zeros_like(m.input_data)具有以下内容:

x = tf.zeros_like(m.input_data).eval()

...这确保了 x转换为 numpy 数组。

(请注意,实现此目的的更直接方法是将初始 x 构造为适当大小的 numpy 数组。)

关于TensorFlow LSTM 生成模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34302042/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com