gpt4 book ai didi

theano - 如何在没有嵌入层的Keras中编写LSTM?

转载 作者:行者123 更新时间:2023-12-04 14:10:21 24 4
gpt4 key购买 nike

如何使用LSTM架构在无嵌入层的情况下在keras中编写简单的序列复制任务?我已经有单词vector了。

最佳答案

如果您说您有单词向量,我想您有字典将单词映射到其向量表示形式(根据word2vec,GloVe ...计算得出)。

使用此字典,您可以将序列中的所有单词替换为其相应的向量。您还需要使所有序列具有相同的长度,因为LSTM需要所有输入序列具有恒定的长度。因此,您将需要确定max_length值并修剪所有较长的序列,并用零填充所有较短的序列(请参阅Keras pad_sequences函数)。

然后,您可以将向量化的序列直接传递到神经网络的LSTM层。由于LSTM层是网络的第一层,因此您需要定义输入形状,在您的情况下为(max_length,embedding_dim,)。

这样,您可以跳过“嵌入”层,而使用自己的预先计算的字向量。

关于theano - 如何在没有嵌入层的Keras中编写LSTM?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37170968/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com