python - 双向 LSTM 合并模式说明-6ren

python - 双向 LSTM 合并模式说明

转载作者：行者123 更新时间：2023-12-03 20:25:11

31

4

我想了解有关使用双向 LSTM 进行序列分类时合并模式的更多详细信息，尤其是对于我还不清楚的“Concat”合并模式。
根据我对这个方案的理解:

在将前向和后向层的合并结果传递到 sigmoid 函数后计算输出 y_t。 “add”、“mul”和“average”合并模式似乎相当直观，但我不明白选择“concat”合并模式时输出 y_t 是如何计算的。实际上，使用这种合并模式，我们现在在 sidmoid 函数之前有一个向量而不是单个值。

最佳答案

在 Bi-LSTM 中，你将有一个 LSTM 从左到右展开(比如 LSTM1)
输入(比如 X)和另一个 LSTM 从右到左展开形式(比如 LSTM2)。

假设您的输入大小(X.shape)是 n X t X f在哪里

n :批量大小

t序列长度/时间步长/没有:展开)

f :No:每时间步的特征

假设我们有一个带有单个 Bi-LSTM 的模型定义如下

model.add(Bidirectional(LSTM(10, return_sequences=True), input_shape=(t, f)))

在这种情况下，LSTM1 将返回大小为 n X t X 10 的输出LSTM2 将返回大小为 n X t X 10 的输出

现在您可以选择如何使用 merge_mode 在每个时间步组合 LSMT1 和 LSTM2 的输出。

总和:在每个时间步将 LSTM1 输出添加到 LSTM2。 IE。 n X t X 10 LSTM1 + n X t X 10 LSTM2 = 输出大小 n X t X 10 多: LSTM1 输出到 LSTM2 在每个时间步的元素乘法，这将导致输出大小 n X t X 10 连接:在每个时间步将 LSTM1 输出按元素连接到 LSTM2，这将导致输出大小为 n X t X 10*2 大街: LSTM1 输出到 LSTM2 在每个时间步长的元素平均值，这将导致输出大小 n X t X 10 无:将 LSTM1 和 LSTM2 输出作为列表返回
基于 merge_mode 组合输出后不应用激活函数.如果要应用激活，则必须在模型中将其明确定义为层。
测试代码

model = Sequential()
model.add(Bidirectional(LSTM(10, return_sequences=True), input_shape=(5, 15), merge_mode='concat'))
assert model.layers[-1].output_shape == (None, 5, 20)

model = Sequential()
model.add(Bidirectional(LSTM(10, return_sequences=True), input_shape=(5, 15), merge_mode='sum'))
assert model.layers[-1].output_shape == (None, 5, 10)

model = Sequential()
model.add(Bidirectional(LSTM(10, return_sequences=True), input_shape=(5, 15), merge_mode='mul'))
assert model.layers[-1].output_shape == (None, 5, 10)

笔记:
您不能使用 merge_mode=None在序列模型中，因为每一层都应该返回一个张量，但是 None返回一个列表，因此您无法将其堆叠在模型中。但是，您可以在 keras 的功能 API 中使用它。

关于python - 双向 LSTM 合并模式说明，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62991082/

31

4

0

文章推荐： google-chrome - 不支持组件树

文章推荐： arrays - Julia:初始化不同类型的数值数组

文章推荐： assembly - 线性、物理、逻辑和虚拟内存地址有什么区别？

Hibernate - 双向@OneToOne
我有 2 个类:User 和 UserPicture，它们具有 1:1 关系。 public class User { @Id @GeneratedValue(strategy=G
ssh - ssh转发-双向
使用ssh转发时，我无法针对远程服务器使用cvs和ftp进行提交。是否可以让服务器对我的机器发起请求-我希望服务器上的Web应用程序调用我的机器上的REST方法。谢谢。尼古拉·G。最佳答案是的
python - 双向 A* 未找到最短路径
我正在 Python 2.7.12 中实现双向 A* 算法，并在 Russell 和 Norvig 第 3 章的罗马尼亚 map 上进行测试。边具有权重，目的是找到两个节点之间的最短路径。这是测试图
java - 双向 map
您能否建议一种映射或类似的数据结构，让我们可以轻松地相互获取值和键。也就是说，每个都可以用来寻找另一个。最佳答案 Java 在其标准库中没有双向映射。例如使用 BiMap 来自Google Gua
Mysql 双向复制(双向)
我想同步两个数据库运行时服务器 A:安装了公共(public) IP 和 mysql 的 Amazon ec2。服务器B:这是局域网中带有mysql的私有(private)机器。 (IP是私有(pr
java - 双向@OneToOne映射使用hibernate创建记录
保存双向@OneToOne 映射时，hibernate 是否应该在两个表上都记录？我有一个包含 applicant_id 列的表 interview，它引用了包含字段 interview_id 的
android - 双向 SwipeRefreshLayout？
我喜欢新的 SwipeRefreshLayout!它看起来很棒，而且非常容易使用。但我想在两个方向上使用它。我有一个消息屏幕，我想通过从上到下滑动来加载旧消息，我想通过从下到上滑动来加载新消息。这个
Android NFC 双向
使用 ICS 4.0.1(愿意升级到 4.0.3)(不会 root 和重写 android 操作系统) 在接收到 android beam 后，是否可以将 NDEF 消息发送回 android 手机
Git 双向 merge
我想知道处理这种 git 场景的最佳方法: Git 仓库:CoreProduct Git repo b: SpecificCustomerProduct 是从 a fork 出来的到目前为止，我们一
python - 双向/反向映射
这个问题在这里已经有了答案: How to implement an efficient bidirectional hash table? (8 个回答) 关闭2年前。我在 python 中做这个
java - 双向 map
您能否推荐一种 map 或类似的数据结构，我们可以在其中轻松地从彼此获取值和键。也就是说，每个都可以用来寻找另一个。最佳答案 Java 在其标准库中没有双向映射。例如使用 BiMap 来自 Goo
java - Java中的双面(双向)列表
Java中是否有类似双面列表的东西？也许第三方实现？这里有一个小例子来证明我的想法。原始状态: 答:0-1-2-3 | | | | 乙:0-1-2-3 删除 B 中的元素 1 后: 空值 | 答:
java - 双向 OneToOne 被多次加载
我有两个实体通过这样的双向 OneToOne 关联连接: @Entity class Parent { @NotNull String businessKey; @OneToO
vagrant - 双向 Vagrant Rsync
我已将 Vagrant 配置为使用 Rsync 共享文件夹而不是(非常慢)vboxsf VirtualBox 默认提供的文件系统: Vagrant.configure("2") do |config|
html - 双向 CSS 高度动画
@keyframes mgm { from { max-height: 250px; } to { max-height: 0px; } } .mgm {
python - 双向 LSTM 合并模式说明
我想了解有关使用双向 LSTM 进行序列分类时合并模式的更多详细信息，尤其是对于我还不清楚的“Concat”合并模式。根据我对这个方案的理解: 在将前向和后向层的合并结果传递到 sigmoid 函数
git - 双向 git 镜像
我有兴趣将本地 git 存储库设置为远程存储库的镜像。我已经阅读了一些可能相关的帖子，但主要区别在于我需要对两个存储库进行读写访问。大多数时候，用户会针对 Repo A 工作，但是有时他们会针对 R
javascript - 查询和改变Firebase实时数据库多对多(双向)关系
我已经仔细阅读了文档 https://firebase.google.com/docs/database/web/read-and-write以及网上很多例子。但这里有一个脱节:在将对象添加到数据库时
java - 双向 onetomany 不更新外键
这个问题已经有答案了: Hibernate bidirectional @ManyToOne, updating the not owning side not working (3 个回答) 已关闭
java - JPA OneToMany 双向
我知道有很多关于它的问题，但我找不到针对我的问题的好的答案。我使用 Jboss 作为 7，Spring 和 Hibernate (4) 作为 JPA 2.0 提供程序，因此我有简单的 @OneToM

首页

博学

6Ren·AI

商城

python - 双向 LSTM 合并模式说明