neural-network - 减少卷积神经网络中的滤波器尺寸-6ren

neural-network - 减少卷积神经网络中的滤波器尺寸

转载作者：行者123 更新时间：2023-12-04 14:40:15

26

4

我正在阅读 Szegedy 等人的 Inception 论文:https://arxiv.org/abs/1512.00567
我无法理解他们如何通过用 2 层 3x3 过滤器替换单个 5x5 过滤器来减少计算量(第 3.1 节)。

特别是，这段话:

If we would naivly slide a network without reusing the computation between neighboring grid tiles, we would increase the computational cost. sliding this network can be represented by two 3x3 convolutional layers which reuses the activations between adjacent tiles.

我不明白我们如何重用这些激活。

最佳答案

所以首先，作者声明了这一点:

This way, we end up with a net (9+9) / 25 × reduction of computation, resulting in a relative gain of 28% by this factorization.

他是对的:对于 óne 5x5 过滤器，您必须使用 25 ( 5*5 ) 个单独的权重。对于两个 3x3 过滤器，您必须使用 9 + 9 ( 3*3 + 3*3 ) 个单独的权重。所以使用两个 3x3 过滤器需要更少的参数。但是，您是对的，这并不意味着它需要更少的计算:乍一看，使用两个 3x3 过滤器需要更多的操作。

让我们比较给定 n*n 的两个选项的操作量输入。演练:

计算给定输入 ( (n - filtersize + 1)^2 ) 上 5x5 滤波器的输出维度，及其对应的操作

计算第一个3x3过滤器的输出维度(公式同上)，及其对应操作

计算第二个 3x3 过滤器的输出维度，及其对应的操作

让我们从 5x5 开始输入:

1. (5 - 5 + 1)^2 = 1x1. So 1*1*25 operations = 25 operations
2. (5 - 3 + 1)^2 = 3x3. So 3*3*9  operations = 81 operations
3. (3 - 3 + 1)^2 = 1x1. So 1*1*9  operations = 9  operations
So 25 vs 90 operations. Using a single 5x5 filter is best for a 5x5 input.

接下来， 6x6输入:

1. (6 - 5 + 1)^2 = 2x2. So 2*2*25 operations = 100 operations
2. (6 - 3 + 1)^2 = 4x4. So 4*4*9  operations = 144 operations
3. (4 - 3 + 1)^2 = 2x2. So 2*2*9  operations = 36  operations
So 100 vs 180 operations. Using a single 5x5 filter is best for a 6x6 input.

让我们先跳一跳， 8x8输入:

1. (8 - 5 + 1)^2 = 4x4. So 4*4*25 operations = 400 operations
2. (8 - 3 + 1)^2 = 6x6. So 6*6*9  operations = 324 operations
3. (4 - 3 + 1)^2 = 4x4. So 4*4*9  operations = 144 operations
So 400 vs 468 operations. Using a single 5x5 filter is best for a 8x8 input.

注意到图案了吗？给定输入大小 n*n , 操作为 5x5过滤器有以下公式:

(n - 4)*(n - 4) * 25

对于 3x3 过滤器:

(n - 2)*(n - 2) * 9 + (n - 4) * (n - 4) * 9

所以让我们绘制这些:

他们似乎相交了!正如您可以从上图中读到的，来自 n=10 的两个 3x3 过滤器的操作次数似乎更少。并继续!

结论:似乎在 n=10 之后使用两个 3x3 过滤器是有效的.此外，不管 n ，与单个 5x5 过滤器相比，两个 3x3 过滤器需要调整的参数更少。

虽然这篇文章有点奇怪，但出于某种原因，它让人感觉像是使用两个 3x3 过滤器而不是一个 5x5 过滤器“明显”:

This setup clearly reduces the parameter count by sharing the weights between adjacent tiles.

it seems natural to exploit translation invariance again and replace the fully connected component by a two layer convolutional architecture

If we would naivly slide

关于neural-network - 减少卷积神经网络中的滤波器尺寸，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43382499/

26

4

0

文章推荐： WCF 缓慢的 ServiceHost.Open() 调用

文章推荐： jenkins - 在节点上创建并行执行的多个阶段

文章推荐： php - 避免开发人员看到包含的纯文本代码。

文章推荐： docker - 运行Docker容器的Docker内部的 Airflow

c - 为什么这个 malloc 包装器对请求的内存大小执行此操作？尺寸 = (尺寸 + 3) & ~3;
我正在查看 DOOM 源代码，我找到了 this行。 void * Z_Malloc (int size, int tag, void *user)
window 尺寸
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 9 年前。 Improve t
c++ - 如何获得特征矩阵的形状(尺寸)？
我正从 Python 和 Numpy 转向 C++ 和 Eigen。在 Python 中，我可以使用 .shape 属性获取 Numpy 数组/矩阵的形状(维度)，如下所示: import nump
youtube - 嵌入YouTube:尺寸
固定嵌入式YouTube视频的宽度并自己照顾自己的高度是否安全？我有一个应用程序，用户可以将通知发布到公告板上。这些通知主要是文本(带有有限的html标签)和嵌入式图像。我现在要添加对嵌入式YouT
javascript - 创建后如何更改盒子的尺寸/尺寸？
可以轻松创建一个 THREE.BoxGeometry，在创建宽度、高度和深度的三个独立参数时，您必须在其中传递参数。我想创建任何和所有不带参数的THREE[types]()，并在之后设置值。有没有
JavaScript Canvas 尺寸
我在 HTML 页面上有一个 Canvas : 属性width和height将 Canvas 拉伸(stretch)到某个字段，但不调整其大小。所以 var canvasElement = docu
CSS 定位/尺寸
我在我的 css 中使用 @media all 和 (max-width: 600px) {} 作为响应式菜单，问题是它没有正确显示。我想让橙色填充绿色空间……当然，还要将绿色空间变成透明的。基本上
c++ - 尺寸、长度换算？
(我知道我问了很多关于这个的问题!) 基本上，我正在尝试将一些代码从 Matlab 转换为 C++，我遇到了这个: n = sum(size(blocks)) - len; 现在我计算了 vector
javascript - 选择类别然后显示类别.尺寸
您好，我有一个用于创建产品的表单。用户应该能够选择类别(例如 T 恤)，然后 T 恤的所有尺码(例如 S、M、L)都会下拉。用户可以输入每种尺寸的数量。 Javascript 对此不起作用。用户可以选
html - 尺寸、对齐方式和列表样式等社交图标命令对页脚没有任何影响
我正在尝试在页脚中定位和调整我的社交图标链接的大小，但是，这些命令似乎都没有效果，尤其是当我尝试调整它们的大小时。我试过将宽度和高度标记为“!重要”，但这也没有效果。这是代码的 JSFiddle:h
canvas - 给定特定尺寸的最大潜在 PNG 尺寸
我目前正在创建一个 HTML5 canvas基于绘图程序。用户可以绘制一张图像或几张图像“页面”，并将其保存到云端以供日后快速检索。这是用于交互式白板的；老师不能总是确定他们计划类(class)使用的
image - 如何为网页保存图像？ (格式/尺寸)
为网站存储图像的最佳方式是什么？我不应该超过什么尺寸？现在，我将所有界面文件保存在 png(主要是 Sprite )中，并将常用图像保存在 jpg 中。一些图像大约为 100-150Kb。保存图
jquery - fancybox iframe 尺寸
在 fancybox 主页 ( http://fancybox.net/home ) 中，有一个打开尺寸为屏幕 75% 的 iFrame 的示例。我无法按照网站上的说明通过修改 .js 文件的宽度和
iPhone 4 Nib 尺寸
我想做一个仅适用于 iPhone 4 的应用程序，该应用程序使用 iAd AdBannerView。当我添加它时，它的固定大小为 320x50。在更高分辨率下这如何工作？有人可以解释一下 iPhon
cocoa - 旋转的 NSString 尺寸
我们有一个 NSString，我们使用 - (NSSize)sizeWithAttributes:(NSDictionary *)attributes 来测量边界框。一切都好。现在我们使用标准 NS
delphi - 如何仅通过知道其句柄来确定 Canvas 尺寸？
我想知道 Canvas 的宽度和高度，但我只知道它的 HDC。我尝试过这段代码: procedure TForm92.Button1Click(Sender: TObject); var hBi
javascript - 旋转路径后计算 SVG 尺寸
问题是如何使用数学从 START SVG 维度(不带旋转)和 END SVG 维度(带旋转)获取 >开始 SVG 信息。基本上，要从 START SVG 到 END SVG，我需要执行 -115.60
oracle - 鱿鱼进口 Parquet 尺寸
我的问题是，我有一个包含50万行的Oracle表。我设置了sqoop以将其作为 Parquet 文件导入到HDFS。我将--num-partition参数设置为32，得到了32个 Parquet 文件
wordpress - YouTube 尺寸 WordPress
是否可以更改 WordPress 中当前主题的 YouTube(或其他视频)的默认嵌入尺寸？我搜索了一个插件和一些代码，但似乎找不到。我的意思是当您将 YouTube 网址粘贴到帖子或页面中时使用的
JavaFX 缩小 ImageView 尺寸
我有一个组，其中包含一个矩形和顶部的图像。我希望矩形可以调整大小，并且图像应该具有固定大小，除非矩形小于图像的情况。然后图像应该随着矩形缩小。图像还应该始终居中并有一些填充。除了图像的缩小尺寸部分

首页

博学

6Ren·AI

商城

neural-network - 减少卷积神经网络中的滤波器尺寸