作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图了解 2D 卷积和 2D depthwise 卷积神经网络计算中的异同。 (我理解这些概念)。
例如,假设有一个 3x3 的输入图像,具有 3 个 channel (RGB),填充为 1,步幅为 1。过滤器为 2x2。
输出是什么? (可以忽略激活和偏差)
我知道常规 conv2D 将有 1 个 3x3 输出,而 dw conv2D 将有 3 个。除此之外我有点困惑。谢谢
最佳答案
例如,让我们考虑输入图像形状为 (5,5,3)
.
卷积层 :
在 Conv2D 中, 24 过滤器 尺寸3*3*3
与输入 5*5*3
复杂.
Conv2D
任何卷积层中每个过滤器的深度将与层的输入形状的深度相同:
input_shape = (1, 5, 5, 3)
x = tf.random.normal(input_shape)
y = tf.keras.layers.Conv2D(24, 3, activation='relu', input_shape=(5,5,3))(x)
print(y.shape) #(1,3,3,24)
深度卷积层 :
z = tf.keras.layers.DepthwiseConv2D(3,activation='relu', input_shape=input_shape[1:])(x)
print(z,shape) #(1,3,3,3)
SeparableConvolution
关于c++ - Conv2D vs Depthwise Conv2D 计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56518367/
我试图了解 2D 卷积和 2D depthwise 卷积神经网络计算中的异同。 (我理解这些概念)。 例如,假设有一个 3x3 的输入图像,具有 3 个 channel (RGB),填充为 1,步幅为
我正在 keras 中开发一个 CNN 来对具有 10 个光谱带的卫星图像进行分类。我在下面的网络中获得了不错的准确度(15 个类的 val 准确度约为 60%),但我想更好地结合单个像素的光谱带之间
我是一名优秀的程序员,十分优秀!