machine-learning - cnn max pooling - 非连续滑动窗口(类似跳过克)？-6ren

machine-learning - cnn max pooling - 非连续滑动窗口(类似跳过克)？

转载作者：行者123 更新时间：2023-11-30 08:46:11

25

4

当使用 keras 构建一个简单的 cnn(如下面的代码)以及当它用于基于文本的问题(例如文档分类)时，我理解这就像我们从文本中提取 4-gram(kernel_size 为 4) )并将它们用作特征。

    model = Sequential()
    model.add(embedding_layer)
    model.add(Conv1D(filters=100, kernel_size=4, padding='same', activation='relu'))
    model.add(MaxPooling1D(pool_size=4))      
    model.add(Dense(4, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

在这种情况下，conv1D 层中的内核大小就像一个大小为 4 的滑动窗口，它遍历文本中的标记序列以发出 4-gram。

我想知道是否有一种方法可以在卷积中创建“非连续滑动窗口”，即生成“skip-gram”等价物。例如，给定以下一维向量:

[a, b, c, d, e, f]

kernel_size=3、skip=1 的 conv1d 将扫描以下序列:

[(a,c,d),(b,d,e),(c,e,f),(d,f,padding),(e,padding,padding)] union [(a,b,d),(b,c,e),(c,d,f),(d,e,padding),(e,f,padding),(f,padding,padding)]

我说“union”的原因只是因为我认为从实现的角度来看，生成第 1 部分或第 2 部分可能更容易，为修改后的 conv1d 层提供另一个参数。如果情况确实如此并且可行，我可以通过连接多个层来解决这个问题。但至少要有一个扩展的 conv1d 层，它需要额外的参数，以便它执行扫描的第一部分或第二部分。

这个想法并不新鲜，因为本文已经对此进行了实验:http://www.aclweb.org/anthology/D/D16/D16-1085.pdf

但是请原谅我对 keras 缺乏深入的了解，我不知道如何实现它。如有任何建议，请，

提前非常感谢

最佳答案

您可以创建一个自定义卷积层，其中权重矩阵中的某些元素为零。

您可以将常规的 Conv1D 图层作为基类。

但在执行此操作之前，请注意，您可以在创建常规卷积层时通过传递 dilation_rate=n 参数来创建“扩张”卷积。这将在窗口中每个获取的克之间跳过 n-1 克。您的窗口将具有固定的规则空间。

为此创建自定义层:

import keras.backend as K


#a 1D convolution that skips some entries
class SkipConv1D(Conv1D):

    #in the init, let's just add a parameter to tell which grams to skip
    def __init__(self, validGrams, **kwargs):

        #for this example, I'm assuming validGrams is a list
        #it should contain zeros and ones, where 0's go on the skip positions
        #example: [1,1,0,1] will skip the third gram in the window of 4 grams   
        assert len(validGrams) == kwargs.get('kernel_size')
        self.validGrams = K.reshape(K.constant(validGrams),(len(validGrams),1,1))
            #the chosen shape matches the dimensions of the kernel
            #the first dimension is the kernel size, the others are input and ouptut channels


        #initialize the regular conv layer:
        super(SkipConv1D,self).__init__(**kwargs)

        #here, the filters, size, etc, go inside kwargs, so you should use them named
        #but you may make them explicit in this __init__ definition
        #if you think it's more comfortable to use it like this


    #in the build method, let's replace the original kernel:
    def build(self, input_shape):

        #build as the original layer:
        super(SkipConv1D,self).build(input_shape)

        #replace the kernel   
        self.originalKernel = self.kernel
        self.kernel = self.validGrams * self.originalKernel

请注意此答案中未考虑的一些事项:

方法get_weights()仍将返回原始内核，而不是具有跳过掩码的内核。 (可以解决这个问题，但是会有额外的工作，如果需要，请告诉我)

该层中存在未使用的权重。这是一个简单的实现。这里的重点是使其尽可能与现有的 Conv 层及其所有功能最相似。也可以仅使用严格必要的权重，但这会大大增加复杂性，并且需要大量重写 keras 原始代码以重新创建所有原始可能性。

如果你的kernel_size太长，定义validGrams变量会很无聊。您可能想要创建一个版本，该版本采用一些跳过的索引，然后将其转换为上面使用的列表类型。

不同的 channel 跳过不同的克数:

如果您不使用形状为 (length,) 的 validGrams，而是使用形状为 (长度，输出过滤器)。

在这种情况下，在创建 validGrams 矩阵时，我们应该将其 reshape 为:

validGrams = np.asarray(validGrams)
shp = (validGrams.shape[0],1,validGrams.shape[1])
validGrams = validGrams.reshape(shp)
self.validGrams = K.constant(validGrams)

您还可以简单地使用许多具有不同参数的并行SkipConv1D，然后连接它们的结果。

inputs = Input(yourInputShape)
out = embedding_layer(inputs)

out1 = SkipConv1D(filters=50,kernel_size=4,validGrams=[1,0,1,1])(out)
out2 = SkipConv1D(filters=50,kernel_size=4,validGrams=[1,1,0,1])(out)

out = Concatenate()([out1,out2]) #if using 'channels_first' use Concatenate(axis=1)
out = MaxPooling1D(pool_size=4)(out)
out = Dense(4, activation='softmax')(out)

model = Model(inputs,out)

关于machine-learning - cnn max pooling - 非连续滑动窗口(类似跳过克)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47303273/

25

4

0

文章推荐： javascript - 为什么不需要 getElementById 来获取表单中的 ID

文章推荐： java - 如何以动态顺序调用java方法？

文章推荐： java - 在多个 jar 文件中重新声明接口(interface)

文章推荐： machine-learning - scikit learn如何实现输出层

deep-learning - 在 R-CNN、fast R-CNN、faster R-CNN 和 YOLO 中哪个最适合对象定位
R-CNN、fast R-CNN、faster R-CNN 和 YOLO 在以下方面有什么区别: (1) 同一图像集上的精度 (2) 给定 SAME IMAGE SIZE，运行时间 (3) 支持安卓移
python - CNN 模型比 CNN-SVM 组合模型具有更好的精度
我试图比较 CNN 模型和组合 CNN-SVM 模型进行分类的准确性结果。然而我发现 CNN 模型比 CNN-SVM 组合模型具有更好的准确性。这是正确的还是可能发生？最佳答案这取决于很多因素，但
machine-learning - 深度 CNN 和密集 CNN 的区别
我知道这可能是一个愚蠢的问题，但我对机器学习和人工神经网络有点陌生。深度卷积神经网络和密集卷积神经网络有什么区别吗？提前致谢! 最佳答案密集 CNN 是深度 CNN 的一种，其中每一层都与比自身
machine-learning - 使用预训练 CNN 提取的特征作为 CNN/NN 的新特征
我正在使用预训练的 CNN 从图片中提取特征。使用这些特征作为新 CNN/NN 的输入有意义吗？以前做过吗？我很高兴得到答复。最佳答案这称为微调。这是非常常用的。通常，我们会删除 VGG 或类似网
neural-network - 尝试使用 Region CNN (R-CNN) 训练 ImageNet 模型
与 caffe 合作几个月后，我已经能够成功地训练我自己的模型。例如，比我自己的模型更进一步，我已经能够用 1000 个类来训练 ImageNet。现在在我的项目中，我试图提取我感兴趣的区域。之后我
python - CNN 中的模型精度和损失没有改善
我正在使用下面的 LeNet 架构来训练我的图像分类模型，我注意到每次迭代都不会提高训练和验证的准确性。这方面的任何专家都可以解释可能出了什么问题吗？训练样本 - 属于 2 个类别的 110 张图像
python - 将剩余连接添加到简单的 CNN
我使用剩余连接实现了以下 CNN，用于在 CIFAR10 上对 10 个类进行分类: class ConvolutionalNetwork(nn.Module): def __init__(se
tensorflow - 具有自定义损失函数的多输入多输出 CNN
我有一组二维输入数组 m x n即 A,B,C我必须预测两个二维输出数组，即 d,e我确实有预期值。如果您愿意，您可以将输入/输出视为灰色图像。由于空间信息是相关的(这些实际上是 2D 物理域)我想
python - 为什么python线程会减慢推理时间以实现更快的R-CNN
我正在开发一个交通跟踪系统，该系统可以分析已经收集的视频。我正在使用opencv，线程，pytorch和dectron2。为了加快从opencv抓帧的速度，我决定使用Thread，该线程运行一个循环，
python - CNN 自动编码器可以有不同的输入和输出维度吗？
我正在解决一个问题，需要我构建一个深度学习模型，该模型必须基于某些输入图像输出另一个图像。值得注意的是，这两个图像在概念上是相关的，但它们没有相同的尺寸。起初我认为具有最终密集层(其参数是输出图像的
python - CNN - 多类分类的错误预测
我正在制作一个卷积网络来预测 3 类图像:猫、狗和人。我训练了又训练它，但是当我传递猫图像来预测时，它总是给出错误的输出。我尝试了其他猫的照片，但结果没有改变。对于人和狗来说没有问题，只是对于猫来说。
python - 如何在不损失准确性的情况下使用不同的 CNN
我接到一项任务，要实现一个卷积神经网络，该网络可以评估 MNIST dataset 中找到的手写数字。网络架构如下所示: 我已经实现了一个与架构相匹配的 CNN，不幸的是它的准确率只有 10% 左右。
python - CNN 对所有输入数据预测相同的类别
我正在尝试在 Keras 中重新创建 CNN 来对点云数据进行分类。 CNN 在 this 中描述。纸。网络设计这是我当前的实现: inputs = Input(shape=(None, 3))
tensorflow - CNN 的模型架构设计
我想为有 300 个类的数据集设计 CNN。我已经用以下模型对两个类(class)进行了测试。它具有良好的准确性。 model = Sequential([ Conv2D(16, 3, padding
python - CNN 模型无法做出预测
我成功训练了 CNN 模型，但是当我向模型提供图像以使其预测标签时，出现错误。这是我的模型(我正在使用 saver.restore 恢复它)... # load dataset mnist = in
python - CNN 批处理不同大小的图像
我恢复了用于人脸检测的预训练模型，该模型一次获取单个图像并返回边界框。如果这些图像具有不同的尺寸，如何才能获取一批图像？最佳答案您可以使用tf.image.resize_images方法来实现这一
python - CNN 的验证准确率没有提高
我有大约 8200 张图像用于人脸检测任务。其中 4800 个包含人脸。其他 3400 张图像包含 3D 人脸面具(由橡胶/ latex 制成)、卡通人脸、猴子脸的图像。我想检测给定的图像是否包含真实
使用 CNN 去噪图像中的图像尺寸
我有一组合成噪声图像。示例如下: 我还有它们相应的干净文本图像作为我的地面实况数据。下面的例子: 两个图像的尺寸为4918 x 5856。它的大小是否适合训练我的执行图像去噪的卷积神经网络？如果没有，
python - 具有动态输入形状的 CNN
大家好! 由于我正在尝试制作一个将灰度图像转换为 RGB 图像的全卷积神经网络，所以我想知道是否可以在不同大小的图像(不同的像素和比率)上训练和测试模型。通常你只会下采样或上采样，这是我不想做的。我听
matlab - CNN 特征的后期融合
我正在研究 CNN 特征的早期和晚期融合。我从 CNN 的多层中获取了特征。对于早期融合，我捕获了三个不同层的特征，然后水平连接它们 F= [F1' F2' F3']; 对于后期融合，我正在阅读此 p

首页

博学

6Ren·AI

商城