作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在试验不同类型的卷积层,以检查它们的计算速度。一开始,我的代码如下。
def conv_block_A(layer):
block = tf.keras.layers.Conv2D(filters=128, kernel_size=3, strides=1, padding='same')(layer)
block = tf.keras.layers.Conv2D(filters=196, kernel_size=3, strides=1, padding='same')(block)
block = tf.keras.layers.Conv2D(filters=128, kernel_size=3, strides=1, padding='same')(block)
block = tf.keras.layers.BatchNormalization(momentum=0.8)(block)
block = tf.keras.layers.LeakyReLU(alpha=0.2)(block)
return block
在浏览了一些博客之后,我将代码更改为
def conv_block_A(layer):
block = tf.keras.layers.SeparableConv2D(filters=128, kernel_size=3, strides=1, padding='same')(layer)
block = tf.keras.layers.SeparableConv2D(filters=196, kernel_size=3, strides=1, padding='same')(block)
block = tf.keras.layers.SeparableConv2D(filters=128, kernel_size=3, strides=1, padding='same')(block)
block = tf.keras.layers.BatchNormalization(momentum=0.8)(block)
block = tf.keras.layers.LeakyReLU(alpha=0.2)(block)
return block
训练过程在 CPU 上快了一倍,但在 Tesla T4 上训练变得非常慢。可能是什么原因?
最佳答案
这是 GPU 的一个已知问题,已在 #33836 中修复.另外,您应该更新您的 GPU 驱动程序。根据经验,通过可分离卷积实现的加速对于大内核尺寸更为明显,因为涉及进行两次卷积的开销可能大于加速。
关于python - 为什么 SeparableConv2D 比 Conv2D 慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60836958/
我是一名优秀的程序员,十分优秀!