python - TensorFlow:为下一批记住 LSTM 状态(有状态 LSTM)-6ren

python - TensorFlow:为下一批记住 LSTM 状态(有状态 LSTM)

转载作者：IT老高更新时间：2023-10-28 20:28:12

28

4

给定一个训练有素的 LSTM 模型，我想对单个时间步执行推理，即以下示例中的 seq_length = 1。在每个时间步之后，需要为下一个“批处理”记住内部 LSTM(内存和隐藏)状态。在推理的最开始，在给定输入的情况下计算内部 LSTM 状态 init_c, init_h。然后将它们存储在传递给 LSTM 的 LSTMStateTuple 对象中。在训练期间，每个时间步都会更新此状态。但是，对于推理，我希望 state 保存在批处理之间，即初始状态只需要在最开始时计算，之后 LSTM 状态应该在每个“批处理”之后保存(n =1)。

我发现了这个相关的 StackOverflow 问题:Tensorflow, best way to save state in RNNs? .然而，这只适用于 state_is_tuple=False，但这种行为很快就会被 TensorFlow 弃用(参见 rnn_cell.py)。 Keras 似乎有一个很好的包装器可以使 stateful LSTMs 成为可能，但我不知道在 TensorFlow 中实现这一点的最佳方法。 TensorFlow GitHub上的这个issue也和我的问题有关:https://github.com/tensorflow/tensorflow/issues/2838

对于构建有状态 LSTM 模型有什么好的建议吗？

inputs  = tf.placeholder(tf.float32, shape=[None, seq_length, 84, 84], name="inputs")
targets = tf.placeholder(tf.float32, shape=[None, seq_length], name="targets")

num_lstm_layers = 2

with tf.variable_scope("LSTM") as scope:

    lstm_cell  = tf.nn.rnn_cell.LSTMCell(512, initializer=initializer, state_is_tuple=True)
    self.lstm  = tf.nn.rnn_cell.MultiRNNCell([lstm_cell] * num_lstm_layers, state_is_tuple=True)

    init_c = # compute initial LSTM memory state using contents in placeholder 'inputs'
    init_h = # compute initial LSTM hidden state using contents in placeholder 'inputs'
    self.state = [tf.nn.rnn_cell.LSTMStateTuple(init_c, init_h)] * num_lstm_layers

    outputs = []

    for step in range(seq_length):

        if step != 0:
            scope.reuse_variables()

        # CNN features, as input for LSTM
        x_t = # ... 

        # LSTM step through time
        output, self.state = self.lstm(x_t, self.state)
        outputs.append(output)

最佳答案

我发现将所有图层的整个状态保存在占位符中是最简单的方法。

init_state = np.zeros((num_layers, 2, batch_size, state_size))

...

state_placeholder = tf.placeholder(tf.float32, [num_layers, 2, batch_size, state_size])

然后解压并创建一个 LSTMStateTuples 元组，然后再使用原生 tensorflow RNN Api。

l = tf.unpack(state_placeholder, axis=0)
rnn_tuple_state = tuple(
[tf.nn.rnn_cell.LSTMStateTuple(l[idx][0], l[idx][1])
 for idx in range(num_layers)]
)

RNN 传入 API:

cell = tf.nn.rnn_cell.LSTMCell(state_size, state_is_tuple=True)
cell = tf.nn.rnn_cell.MultiRNNCell([cell]*num_layers, state_is_tuple=True)
outputs, state = tf.nn.dynamic_rnn(cell, x_input_batch, initial_state=rnn_tuple_state)

state - 变量将作为占位符提供给下一批。

关于python - TensorFlow:为下一批记住 LSTM 状态(有状态 LSTM)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38241410/

28

4

0

文章推荐： java - 以编程方式从 PEM 获取 KeyStore

文章推荐： python - 将python源代码拆分为多个文件？

文章推荐： java - Java中的 "(Object)null"和 "null"有什么区别？

assembly - 他们如何如此快地将十进制转换为十六进制(记住)？
我观察到很少有逆向工程师，他们将十进制转换为十六进制的速度如此之快。这简直太神奇了。我一直没有机会问他们。就我个人而言，我真的很讨厌这个转换，而且我总是使用计算器进行转换。我想知道这种转换是否有某种
Java - 记住/保存输入字段的程序
我有一个程序使用三个 JTextField 字段作为主要数据输入字段。我想要它，以便当用户终止程序然后再次打开它时，他们的最后一个条目仍将在字段中。我怎样才能做到这一点？我需要某种数据库还是有更简单
javascript - 记住 $(this) 是什么
我有以下脚本将 jquery 生成的对象的颜色更改为蓝色: $(".objects_list").live('click', function(event) { $(this).css("co
reactjs - 记住 React 中的所有内容是一种不好的做法吗？
这个问题在这里已经有了答案: Is it a good idea to memoize all of my react components? (2 个答案) 关闭去年。我知道使用 React.m
r - 记住 Rcpp 函数？
我在 R 中编写了一个递归函数并使用 memoise 来加速它。我试图通过在 Rcpp 中编写它然后记住 Rcpp 函数来进一步加快它的速度，但 R 函数更快。为什么会这样，有什么方法可以加快我的使用
iphone - NSUserDefaults 记住 View
我的应用程序包含几个 View ，我想在应用程序启动且用户尚未完成向导时显示一个小设置。我知道我可以使用 NSUserDefaults 实现此目的，但我不确定如何使其根据 NSUserDefaults
delphi - Delphi“记住”旧的DCU依赖关系
我正在从一台机器（相同版本的Delphi）开发应用程序。该应用程序的原始版本使用了TMS包中的TMoneyEdit组件。在移动项目时，我想删除对该产品的依赖。因此，在源代码中，我删除了TMoneyEd
sql - 如何“记住”一个值插入到SQLite的两个表？
我有一个触发器，希望将相同的随机值插入两个表中。我该怎么做呢？在TableAB上插入后创建触发器insertTrigger 开始插入TableA（id，num）VALUES（RANDOM（），1）
Javascript 记住 HTML 标签内容并在持续时间后替换
我有以下代码，通过 .swf 解决方案将服务器 IP 复制到客户端的剪贴板。正如您所看到的，它用成功的“已复制”消息替换了“复制 IP”按钮。我该如何让“复制 IP”按钮在显示成功消息 5 秒后返回，
javascript - 记住 GPS 权限状态
我正在使用 GPS 定位功能，问题是权限弹出窗口一遍又一遍地出现(每次新的网址刷新/按 F5 键)。我如何记住用户在浏览器中选择的状态(已批准或已拒绝)。 if (navigator.geoloca
javascript - 记住 "click"之前的原始状态
有一个按钮(实际上有很多)，它有一个事件处理程序: el.onclick = function(){ if(this.className.indexOf("minimized") != -1)
javascript - 记住 JavaScript 跨页幻灯片中的图像编号
我正在制作一个纯 html+JavaScript 幻灯片。幻灯片位于网站的侧边栏中，该网站为每个具有幻灯片侧边栏的页面加载了 php。唯一没有侧边栏的页面是主页。幻灯片放映工作正常。然而，可以理解的
javascript - 记住 Chrome 扩展中的大字符串
我想制作一个 Chrome 扩展程序，它将存储来自用户的潜在大型代码片段(以及代码片段的名称)并使用它们。我希望用户能够上传包含这些片段的文件(或者更好的是，将这些片段复制并粘贴到扩展程序选项页面的
methods - 记住 Groovy 中的成员方法
我有一个方法是 pure function并需要一段时间才能运行。我想记住这个方法，以便后续调用更快。我可以在 Groovy 的文档中看到，您可以通过以下方式内存闭包: foo = {…}.memoi
jquery - 记住 jQuery 中的触发器
[jQuery][1] 始终记住您的鼠标触发器，无论是单击还是悬停。因此，如果您鼠标输入和鼠标退出四次，它将执行该事件四次。如何让它“忘记”触发器，以便当我用鼠标输入和退出触发器时它只执行一次？编
unix - 记住 *nix 命令行参数
对于我的开发人员工作，我几乎整天都在 *nix shell 环境中工作，但似乎仍然无法记住我每天不使用的程序的名称和参数细节。我想知道其他“临时健忘症患者”是如何处理这个问题的。你有一个大的备忘单吗？
php - 记住 cookie 中的表单值以便稍后完成
我有一个表格，在客户填写各种表格后，我希望能够浏览网站，并返回表格并保持填写状态。我考虑过在浏览器的客户端中保留 cookie，您可能会推荐其他方法吗？关于代码，这里是 o 想到的 javascr
swift 。记住 Facebook 登录信息
好的，我已经实现了 Facebook 登录按钮: loginButton.readPermissions = ["public_profile", "email", "user_friends"] l
javascript - 记住 AngularJS 中选项卡之间的计数
我在移动应用程序中使用 AngularJS。用户能够将产品添加到订单中。但是我使用了不同的选项卡，以便用户可以在类别之间切换，并且对于每个类别，都会显示属于该类别的产品。这些产品可以添加到他/她的订单
android - 记住 ListView 中选中的复选框
我有一个使用自定义适配器、布局和模型类的 ListView (包含文本和复选框)。我想将选定的复选框保存在 sqlite 数据库中，以便当我导航到另一个 Activity 然后返回时，选定的复选框保持

首页

博学

6Ren·AI

商城

python - TensorFlow:为下一批记住 LSTM 状态(有状态 LSTM)