gpt4 book ai didi

python - Conv3d 与 Conv2d 之间的区别

转载 作者:行者123 更新时间:2023-12-01 08:50:00 34 4
gpt4 key购买 nike

我对 conv2d 和 conv3d 函数之间的区别有点困惑。例如,如果我有一堆 N 个图像,高度为 H,宽度为 W,并且有 3 个 RGB channel 。网络的输入可以有两种形式form1: (batch_size, N, H, W, 3) 这是一个 5 阶张量form2: (batch_size, H, W, 3N ) 这是一个 4 阶张量

问题是,如果我将具有大小为 (N,3,3) 的 M 个过滤器的 conv3d 应用到 f​​orm1 并应用具有大小为 (3,3) 的 M 个过滤器的 conv2d

它们的功能操作基本相同吗?我认为这两种形式都在时间和空间维度上交织在一起。

如果有人能帮我解决这个问题,我真的很感激。

最佳答案

如果您有一堆图像,那么您就有一个视频。您不能有两个输入表单。您有图像或视频。对于视频情况,您可以使用 3D 卷积,但未为其定义 2D 卷积。如果您按照您提到的方式堆叠 channel (3N),则 2D 卷积会将堆栈解释为具有大量 channel 的一张图像,而不是堆栈。

请注意,使用 (batch, H, W, Channels) 的 2D 卷积与使用 (batch, H, W, Channels, 1) 的 3D 卷积相同。

关于python - Conv3d 与 Conv2d 之间的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53164733/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com