gpt4 book ai didi

machine-learning - 为什么VGG16网络中的卷积层是64层?又是如何确定的呢?

转载 作者:行者123 更新时间:2023-11-30 08:37:13 27 4
gpt4 key购买 nike

有人可以向我解释一下为什么 VGG16 网络的第一个卷积层的宽度是 64 吗?我知道沿网络的层大小加倍,但我不确定一开始是如何确定 64 的。

最佳答案

VGG16中第一个卷积层的输入是尺寸为224x224x3的图像。第一个卷积层的输出体积的形状为 224x244x64(输入图像中每个 channel 为 x3)。值 64 是新体积的深度(或 channel - 在论文中他们称之为宽度,这在我看来是令人困惑的),是对输入体积(图像)上的 64 个滤波器中的每个滤波器进行卷积运算的结果 - 考虑每个滤波器过滤器将新层堆叠到卷上。 conv1_1 中选择 64 个滤波器是一项设计决策,他们没有对此进行解释,但与管理可训练参数的数量有关。

滤波器数量加倍(64、128、256 ...)也是一个设计决策。有人说,一个经验法则是在池化层的下采样操作中通过乘数的倒数来增加滤波器的数量。在 VGG16 架构中,他们在池化层中使用步长 2。因此,他们根据这个粗略方程(宽度和高度相等)将输入体积的宽x高粗略地下采样 50%:

宽度输出 = (宽度输入 - FilterSize + 2*Padding)/步长+1

在 VGG16 pool1 输出中:

宽度输出 = ( 224 − 3 + 2*0 )/2 +1 = 111.5 ≅ 112

池化下采样 50% (224/2),因此让下一个卷积层中的滤波器加倍 (64*2)

关于machine-learning - 为什么VGG16网络中的卷积层是64层?又是如何确定的呢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43778401/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com