gpt4 book ai didi

TensorFlow:如何使用具有可变输入长度的 CudnnLSTM(如 dynamic_rnn)?

转载 作者:行者123 更新时间:2023-12-04 01:24:36 26 4
gpt4 key购买 nike

我想加速我的 LSTM 网络,但是当我将它用于 OCR(其中序列具有可变长度)时,我不能使用普通的 LSTM 实现。这就是我使用“tf.nn.dynamic_rnn”的原因。

基于 tensorflow 中的 RNN 基准( https://github.com/tensorflow/tensorflow/blob/754048a0453a04a761e112ae5d99c149eb9910dd/tensorflow/contrib/cudnn_rnn/python/kernel_tests/cudnn_rnn_ops_benchmark.py#L77 ),CUDNN 实现用于一次创建所有模型(它不像其他人那样使用“tf.nn.rnn”结构)。我认为使用可变长度的 CUDNN 可能是不可能的,但也许有人成功了?

其次,这是使用“tf.nn.bidirectional_dynamic_rnn”,因为我想将 Bi-LSTM 用于 OCR。但这应该在实现第一部分后解决。

编辑:看起来“tf.contrib.cudnn_rnn.CudnnLSTM”内部有“双向”实现。所以唯一未知的是CUDNN可以与可变输入序列一起使用。

或者任何使用“CudnnLSTM”的工作示例都会有所帮助。

最佳答案

刚刚发现这个:

tf.contrib.cudnn_rnn.CudnnLSTM currently does not support batches with sequences of different length, thus this is normally not an option to use.



来源: http://returnn.readthedocs.io/en/latest/tf_lstm_benchmark.html

关于TensorFlow:如何使用具有可变输入长度的 CudnnLSTM(如 dynamic_rnn)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40278565/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com