gpt4 book ai didi

machine-learning - 了解卷积神经网络的输出

转载 作者:行者123 更新时间:2023-11-30 09:18:37 26 4
gpt4 key购买 nike

我一直在尝试理解卷积神经网络,但我弄乱了它的输出大小。

这个公式非常简单,但我最终还是感到困惑。我从互联网上的许多来源学习,例如 AndrewNg 的 deeplearning.ai。

这就是我感到困惑的地方。

输出大小 = 输入大小 - 过滤器 + 1

如果我的 InputSize11 x 11 x 16 并且我使用 max poolfilter size 2。通过数学计算,我的形状应该是 5.5 x 5.5 x 16

这个浮点值(5.5)会四舍五入还是在您输入时会被视为5

最佳答案

您描述的公式是特定设置的部分情况。一个general formula是这样的:

W2 = (W1 - F + 2*P) / S + 1
H2 = (H1 - F + 2*P) / S + 1

如您所见,它不仅取决于过滤器大小F,还取决于步幅S和填充大小P(所以您的公式仅适用于 P=0S=1)。

在最大池化的情况下,S通常为2,以便池化执行图像下采样。结果仅取决于填充:

  • 如果P=0,结果将为5x5x16(即,它是该值的上限)。
  • 如果P=1,结果将为6x6x16
  • 任何更大的填充都没有任何意义,但您可以使用上面的公式计算输出大小。

这是 keras 中的示例代码:

input = Input(shape=(11, 11, 16))
print(MaxPool2D(pool_size=(2, 2), strides=2, padding='valid')(input).shape)
# >>> (?, 5, 5, 16)
print(MaxPool2D(pool_size=(2, 2), strides=2, padding='same')(input).shape)
# >>> (?, 6, 6, 16)

关于machine-learning - 了解卷积神经网络的输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48537160/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com