gpt4 book ai didi

python - Keras Conv2D 和输入 channel

转载 作者:IT老高 更新时间:2023-10-28 22:11:29 25 4
gpt4 key购买 nike

Keras 层文档指定了卷积层的输入和输出大小: https://keras.io/layers/convolutional/

输入形状:(samples, channels, rows, cols)

输出形状:(samples, filters, new_rows, new_cols)

并且内核大小是一个空间参数,即仅确定宽度和高度。

因此,带有 c channel 的输入将产生带有 filters channel 的输出,而不管 c 的值如何。因此,它必须使用空间 height x width 过滤器应用 2D 卷积,然后以某种方式为每个学习的过滤器聚合结果。

这个聚合运算符是什么?它是跨 channel 的总和吗?我可以控制它吗?我在 Keras 文档中找不到任何信息。

谢谢。

最佳答案

它被称为 Conv2D 层可能会令人困惑(对我来说,这就是我来寻找这个答案的原因),因为正如 Nilesh Birari 评论的那样:

I guess you are missing it's 3D kernel [width, height, depth]. So the result is summation across channels.

也许2D源于内核只沿二维滑动,第三维是固定的,由输入 channel 的数量(输入深度)。

如需更详细的解释,请阅读 https://petewarden.com/2015/04/20/why-gemm-is-at-the-heart-of-deep-learning/

我从那里提取了一张说明性图片:

kernel depth

关于python - Keras Conv2D 和输入 channel ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43306323/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com