gpt4 book ai didi

python - Conv2dTranspose 产生错误的输出形状

转载 作者:行者123 更新时间:2023-12-01 07:34:57 25 4
gpt4 key购买 nike

我目前正在尝试修改 mobilenetv2,以便它检测图像中的某些对象并返回标记所述对象位置的热图。为此,热图必须具有与输入图像完全相同的分辨率。

我的方法是构建某种类似 U-Net 的编码器-解码器网络,利用 Conv2dTranspose 将移动网络的输出缩放回其原始形状,并通过通往每个相应卷积的快捷路径来降低分辨率。

第一个对应层之间的第一个串联效果很好,但第二个则失败,因为它们的输出形状不匹配。正如我预期的那样,第一个 Conv2dTranspose 将分辨率提高了 2 倍。然而第二个却没有。它具有输入形状 (None, 20, 80, 192),并且应该输出 (None, 40, 160, 144)。不幸的是,实际的输出形状是 (None, 36, 156, 144),使得层的串联变得不可能。

如何获得一致的输出形状?我认为这就是 padding='same' 应该保证的?非常感谢您的帮助!

到目前为止,我已经尝试更改填充类型、设置output_padding参数、步幅和过滤器大小。令人惊讶的是,这些都没有以所需的方式影响输出形状。

base_model = MobileNetV2(input_shape=(imageShape[0], 
imageShape[1], 3), include_top=False, weights='imagenet')
conv_layers = get_conv_layers(base_model)

x = base_model.output

c = conv_layers.pop()
c = conv_layers.pop()
x = Conv2DTranspose(filters=c.output_shape[-1],
kernel_size=(3, 3), strides=(2, 2),
activation='relu', padding='same',
kernel_initializer='he_normal')(x)
x = concatenate([c.output, x], axis=-1)
x = Conv2D(filters=c.output_shape[-1], kernel_size=(3, 3),
activation='relu')(x)

c = conv_layers.pop()
x = Conv2DTranspose(filters=c.output_shape[-1],
kernel_size=(3, 3), strides=(2, 2),
activation='relu', padding='same',
kernel_initializer='he_normal')(x)
x = concatenate([c.output, x], axis=-1)
x = Conv2D(filters=c.output_shape[-1], kernel_size=(3, 3),
activation='relu')(x)

ValueError:Concatenate 层需要具有匹配形状的输入(除了连接轴之外)。获得输入形状:[(None, 40, 160, 144), (None, 36, 156, 144)]

第一个形状是 Conv2dTranspose 输出的所需形状,第二个形状是实际形状。这些应该是相同的,以便串联工作。

最佳答案

好吧,我明白了,有时你只需要暂时远离问题一段时间。事实证明,我太关注 Conv2dTranspose 是罪魁祸首,以至于我完全忽略了中间还有其他层可能导致问题。毕竟我忘记将普通 Conv2d 的填充设置为“相同”。正确设置此参数解决了问题,我得到了预期的输出形状。

关于python - Conv2dTranspose 产生错误的输出形状,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57029838/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com