gpt4 book ai didi

python - 多层bidirectional_dynamic_rnn : incompatible with MultiRNNCell?

转载 作者:太空宇宙 更新时间:2023-11-03 12:02:59 24 4
gpt4 key购买 nike

我想在 Tensorflow 中创建一个多层双向 LSTM。目前我的单层模型如下所示:

cell_fw = tf.contrib.rnn.LSTMCell(hidden_size)
cell_bw = tf.contrib.rnn.LSTMCell(hidden_size)

(self.out_fw, self.out_bw), _ = tf.nn.bidirectional_dynamic_rnn(cell_fw, cell_bw, input, ...)

为了将其变成多层,我怀疑我不能像这样用MultiRNNCell简单地包装一些LSTMCell :

multi_cell_fw = tf.contrib.rnn.MultiRNNCell([cell_fw] * num_layers, ...)

并将它们馈送到 bidirectional_dynamic_rnn,因为每一层中的前向和后向 LSTM 都需要前一层的前向和后向输出。目前我的解决方案是在循环中创建我的 bidirectional_dynamic_rnn,输入前面层的 LSTM 的串联输出。

但是,它不是很干净,坦率地说,我不确定它是否正确,尽管它确实适用于玩具数据集。有没有比使用 MultiRNNCell 这样的方法更优雅的更好方法?

我正在使用 Tensorflow API r1.0。

最佳答案

只是做:

multi_cell_fw = tf.contrib.rnn.MultiRNNCell([cell_fw for _ in range(num_layers)], ...)

这应该有效。

关于python - 多层bidirectional_dynamic_rnn : incompatible with MultiRNNCell?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42660701/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com