python - 当形状不匹配时，如何在 keras 中使用双向 RNN 和 Conv1D？-6ren

python - 当形状不匹配时，如何在 keras 中使用双向 RNN 和 Conv1D？

转载作者：行者123 更新时间：2023-12-01 02:24:24

25

4

我是 Deep-Learning 的新手所以我正在阅读Deep Learning with Keras by Antonio Gulli并学到很多东西。我想开始使用一些概念。我想尝试实现一个具有一维卷积层的神经网络，该网络输入到双向循环层(如下面的论文)。我遇到的所有教程或代码片段都没有实现与此类似的远程任何内容(例如图像识别)或使用旧版本的 keras具有不同的功能和用途。

<小时/>

我想做的是 this paper 的变体:

(1) 将DNA序列转换为one-hot encoding载体； ✓

(2) 使用一维卷积神经网络； ✓

(3) 具有最大池化； ✓

(4) 将输出发送到bidirectional RNN ; ⓧ

(5)对输入进行分类；

<小时/>

我不知道如何使 Bidirectional RNN 上的形状匹配。我连普通的RNN都买不到到这个阶段去工作。 如何重组传入层以与双向 RNN 一起使用？

注意:原始代码来自https://github.com/uci-cbcl/DanQ/blob/master/DanQ_train.py但我简化了输出层，只进行二元分类。此处理在 https://github.com/fchollet/keras/issues/3322 中进行了(某种程度上)描述。但我无法让它与更新的 keras 一起使用。原始代码(和第二个链接)适用于非常大的数据集，因此我生成一些假数据来说明这个概念。他们还使用旧版本的 keras从那时起，关键功能发生了变化。

# Imports
import tensorflow as tf
import numpy as np
from tensorflow.python.keras._impl.keras.layers.core import *
from tensorflow.python.keras._impl.keras.layers import Conv1D, MaxPooling1D, SimpleRNN, Bidirectional, Input
from tensorflow.python.keras._impl.keras.models import Model, Sequential

# Set up TensorFlow backend
K = tf.keras.backend
K.set_session(tf.Session())
np.random.seed(0) # For keras?

# Constants
NUMBER_OF_POSITIONS = 40
NUMBER_OF_CLASSES = 2
NUMBER_OF_SAMPLES_IN_EACH_CLASS = 25

# Generate sequences
https://pastebin.com/GvfLQte2

# Build model
# ===========
# Input Layer
input_layer = Input(shape=(NUMBER_OF_POSITIONS,4))
# Hidden Layers
y = Conv1D(100, 10, strides=1, activation="relu", )(input_layer)
y = MaxPooling1D(pool_size=5, strides=5)(y)
y = Flatten()(y)
y = Bidirectional(SimpleRNN(100, return_sequences = True, activation="tanh", ))(y)
y = Flatten()(y)
y = Dense(100, activation='relu')(y)
# Output layer
output_layer = Dense(NUMBER_OF_CLASSES, activation="softmax")(y)

model = Model(input_layer, output_layer)
model.compile(optimizer="adam", loss="categorical_crossentropy", )
model.summary()


# ~/anaconda/lib/python3.6/site-packages/tensorflow/python/keras/_impl/keras/layers/recurrent.py in build(self, input_shape)
#    1049     input_shape = tensor_shape.TensorShape(input_shape).as_list()
#    1050     batch_size = input_shape[0] if self.stateful else None
# -> 1051     self.input_dim = input_shape[2]
#    1052     self.input_spec[0] = InputSpec(shape=(batch_size, None, self.input_dim))
#    1053 

# IndexError: list index out of range

最佳答案

您根本不需要重构任何内容即可将 Conv1D 层的输出放入 LSTM 层。

所以，问题就在于 Flatten 层的存在，它破坏了形状。

这些是 Conv1D 和 LSTM 使用的形状:

Conv1D:(批处理、长度、 channel )
LSTM:(批处理、时间步长、特征)

长度与时间步数相同， channel 与特征相同。

使用双向包装器也不会改变任何事情。它只会复制您的输出特征。

<小时/>

分类。

如果您要将整个序列作为一个整体进行分类，则最后一个 LSTM 必须使用 return_sequences=False。 (或者你可以在之后使用一些扁平+密集代替)

如果您要对序列的每个步骤进行分类，则所有 LSTM 都应具有 return_sequences=True。您不应该展平它们之后的数据。

关于python - 当形状不匹配时，如何在 keras 中使用双向 RNN 和 Conv1D？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47543113/

25

4

0

文章推荐： javascript - 解析云代码获取指针

文章推荐： javascript - 识别 JavaScript 中的恶意文件上传

文章推荐： python - skimage 色彩空间转换将图像转为静态

Hibernate - 双向@OneToOne
我有 2 个类:User 和 UserPicture，它们具有 1:1 关系。 public class User { @Id @GeneratedValue(strategy=G
ssh - ssh转发-双向
使用ssh转发时，我无法针对远程服务器使用cvs和ftp进行提交。是否可以让服务器对我的机器发起请求-我希望服务器上的Web应用程序调用我的机器上的REST方法。谢谢。尼古拉·G。最佳答案是的
python - 双向 A* 未找到最短路径
我正在 Python 2.7.12 中实现双向 A* 算法，并在 Russell 和 Norvig 第 3 章的罗马尼亚 map 上进行测试。边具有权重，目的是找到两个节点之间的最短路径。这是测试图
java - 双向 map
您能否建议一种映射或类似的数据结构，让我们可以轻松地相互获取值和键。也就是说，每个都可以用来寻找另一个。最佳答案 Java 在其标准库中没有双向映射。例如使用 BiMap 来自Google Gua
Mysql 双向复制(双向)
我想同步两个数据库运行时服务器 A:安装了公共(public) IP 和 mysql 的 Amazon ec2。服务器B:这是局域网中带有mysql的私有(private)机器。 (IP是私有(pr
java - 双向@OneToOne映射使用hibernate创建记录
保存双向@OneToOne 映射时，hibernate 是否应该在两个表上都记录？我有一个包含 applicant_id 列的表 interview，它引用了包含字段 interview_id 的
android - 双向 SwipeRefreshLayout？
我喜欢新的 SwipeRefreshLayout!它看起来很棒，而且非常容易使用。但我想在两个方向上使用它。我有一个消息屏幕，我想通过从上到下滑动来加载旧消息，我想通过从下到上滑动来加载新消息。这个
Android NFC 双向
使用 ICS 4.0.1(愿意升级到 4.0.3)(不会 root 和重写 android 操作系统) 在接收到 android beam 后，是否可以将 NDEF 消息发送回 android 手机
Git 双向 merge
我想知道处理这种 git 场景的最佳方法: Git 仓库:CoreProduct Git repo b: SpecificCustomerProduct 是从 a fork 出来的到目前为止，我们一
python - 双向/反向映射
这个问题在这里已经有了答案: How to implement an efficient bidirectional hash table? (8 个回答) 关闭2年前。我在 python 中做这个
java - 双向 map
您能否推荐一种 map 或类似的数据结构，我们可以在其中轻松地从彼此获取值和键。也就是说，每个都可以用来寻找另一个。最佳答案 Java 在其标准库中没有双向映射。例如使用 BiMap 来自 Goo
java - Java中的双面(双向)列表
Java中是否有类似双面列表的东西？也许第三方实现？这里有一个小例子来证明我的想法。原始状态: 答:0-1-2-3 | | | | 乙:0-1-2-3 删除 B 中的元素 1 后: 空值 | 答:
java - 双向 OneToOne 被多次加载
我有两个实体通过这样的双向 OneToOne 关联连接: @Entity class Parent { @NotNull String businessKey; @OneToO
vagrant - 双向 Vagrant Rsync
我已将 Vagrant 配置为使用 Rsync 共享文件夹而不是(非常慢)vboxsf VirtualBox 默认提供的文件系统: Vagrant.configure("2") do |config|
html - 双向 CSS 高度动画
@keyframes mgm { from { max-height: 250px; } to { max-height: 0px; } } .mgm {
python - 双向 LSTM 合并模式说明
我想了解有关使用双向 LSTM 进行序列分类时合并模式的更多详细信息，尤其是对于我还不清楚的“Concat”合并模式。根据我对这个方案的理解: 在将前向和后向层的合并结果传递到 sigmoid 函数
git - 双向 git 镜像
我有兴趣将本地 git 存储库设置为远程存储库的镜像。我已经阅读了一些可能相关的帖子，但主要区别在于我需要对两个存储库进行读写访问。大多数时候，用户会针对 Repo A 工作，但是有时他们会针对 R
javascript - 查询和改变Firebase实时数据库多对多(双向)关系
我已经仔细阅读了文档 https://firebase.google.com/docs/database/web/read-and-write以及网上很多例子。但这里有一个脱节:在将对象添加到数据库时
java - 双向 onetomany 不更新外键
这个问题已经有答案了: Hibernate bidirectional @ManyToOne, updating the not owning side not working (3 个回答) 已关闭
java - JPA OneToMany 双向
我知道有很多关于它的问题，但我找不到针对我的问题的好的答案。我使用 Jboss 作为 7，Spring 和 Hibernate (4) 作为 JPA 2.0 提供程序，因此我有简单的 @OneToM

首页

博学

6Ren·AI

商城

python - 当形状不匹配时，如何在 keras 中使用双向 RNN 和 Conv1D？

分类。