gpt4 book ai didi

machine-learning - 为什么扩张卷积可以保持分辨率?

转载 作者:行者123 更新时间:2023-11-30 08:25:28 25 4
gpt4 key购买 nike

enter image description here

动画来自here 。我想知道为什么扩张卷积声称可以保持分辨率。显然蓝色的输入是 7x7,绿色的输出是 3x3。

编辑:

解决分辨率损失的一种方法是用当前感受野大小的大约一半来填充输入,但是

  1. 这本质上破坏了扩张卷积不会失去分辨率的说法,因为它是保留分辨率的填充。为了获得与输入相同的输出大小,传统的卷积需要更少的填充。
  2. 由于填充呈指数级增长,相对不小的膨胀因子将导致输入图像被大量填充。想象一下 1024x1024 输入经过 10 倍膨胀,它将变成大约 2048x2048(如果我错了,请告诉我)。这是原始大小的 4 倍,这意味着大部分卷积是在填充区域而不是真实输入上完成的。就我个人而言,这似乎非常违反直觉。

最佳答案

这确实是一个带有 5x5 滤波器的扩张卷积。如果您将动画的蓝色部分想象为 0 填充的 3x3 图像,它会保留分辨率。

关于您的编辑,重点实际上在于您链接的帖子中的这一声明:扩张卷积支持感受野的指数扩展,而不会损失分辨率或覆盖范围

填充是为了保持分辨率。那是对的。

我们真正想要的是扩大感受野的大小。在您链接的帖子中,通过 3 个 3x3 扩张卷积以不断增加的扩张,我们已经在特征图中实现了 15x15 的感受野。

为了实现 3x3 卷积的等效效果,并且无覆盖范围损失无分辨率损失,我们可以使用 3 的步幅来实现(4 会导致损失的覆盖范围)和非常重的填充(就像你所说的那样,与大部分填充的零进行卷积)。但是,我们需要 4 个 3x3 卷积,步幅为 3 而不是 3,才能实现 15x15 的感受野。

最重要的是,与扩张卷积情况相比,正常卷积会有更多没有意义的卷积。

关于machine-learning - 为什么扩张卷积可以保持分辨率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45809486/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com