- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在许多有关卷积神经网络(CNN)的研究论文中,我看到人们从图像中随机裁剪出一个正方形区域(例如224x224),然后将其水平随机翻转。为什么要随机裁剪和翻转?另外,为什么人们总是在正方形区域上裁剪。 CNN不能在矩形区域上工作吗?
最佳答案
这称为数据增强。通过对训练数据进行转换,您可以添加综合数据点。这使模型面临其他变化,而无需花费更多的时间来收集和注释更多数据。这可以减少过拟合并提高模型的泛化能力。
翻转图像的直觉是,对象应与其镜像一样可识别。请注意,水平翻转是经常使用的翻转类型。垂直翻转并不总是有意义,但这取决于数据。
裁剪背后的想法是减少背景对CNN决策的影响。如果您有用于定位对象位置的标签,这将很有用。这使您可以将周围区域用作负面示例并构建更好的检测器。随机裁剪还可以充当正则化器,并根据对象的各个部分的存在来进行分类,而不是将所有内容都集中在可能并不总是存在的非常独特的功能上。
人们为什么总是在正方形区域上裁剪?
这不是CNN的限制。这可能是对特定实现的限制。或通过设计,因为假设平方输入可以优化速度实现。我不会读太多。
输入大小可变与固定输入的CNN:
这并非特定于裁剪为正方形,而是更普遍地说,为什么有时在输入到CNN之前会重新调整输入大小/裁剪/扭曲输入:
要记住的一点是,设计CNN涉及决定是否支持可变大小的输入。卷积运算,池化和非线性将适用于任何输入维度。但是,当使用CNN求解图像分类时,通常会遇到诸如Logistic回归或MLP之类的完全连接的层。 CNN完全连接的层是如何生成固定大小的输出矢量的。固定大小的输出可以将CNN限制为固定大小的输入。
肯定存在一些变通办法,以允许可变大小的输入并仍然产生固定大小的输出。最简单的方法是使用卷积层对图像中的常规小块进行分类。这个想法已经存在了一段时间。其背后的目的是检测图像中物体的多次出现并对每个出现进行分类。我能想到的最早的例子是Yann LeCun的小组在1990年代对simultaneously classify and localize digits in a string所做的工作。
这被称为将具有完全连接的层的CNN变成完全卷积的网络。 Most recent examples of fully-convolutional networks用于解决语义分割并对图像中的每个像素进行分类。在此需要产生与输入尺寸匹配的输出。
另一种解决方案是在CNN的末尾使用全局池化,以将可变大小的要素映射转换为固定大小的输出。池化窗口的大小设置为等于从上一次转化计算得出的特征图。层。
关于image-processing - 卷积神经网络中的随机裁剪和翻转,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32842308/
我有一个数据集,我试图在其中探索将变量限制在给定值并将超出的部分滚动到后续间隔的影响。我可以从概念上看到一些方法可以使用 cumsum() 来做到这一点。或类似的,但正在努力了解如何以合乎逻辑的方式实
我正在开发一个使用 iPhone 前置摄像头的应用程序。当使用该相机拍摄图像时,iPhone 会水平扭曲图像。我想将其镜像回来,以便能够保存它并按照在 iPhone 屏幕上看到的方式显示它。 我读了很
这是 HTML // stuff here Order /
我正在使用 Jquery - 是否有一种简单的方法可以在用户滑过 div 时更改它的背景颜色? 最佳答案 你可以用 CSS 做到这一点: #myDiv:hover { background-color
有谁知道是否可以翻转图像并在其背面显示内容。这就是我的意思:想象一下你手里拿着一张肖像。然后你翻转并查看肖像的背面,背面有文字。我正在寻找类似的东西,单击图像将镜像/翻转到另一侧,上面有文字。不可90
我在翻车方面遇到了一些麻烦..希望你能帮助我! 我正在使用 li 导航,我希望有单独的框链接到不同的页面。这部分很好,可以正常工作。我希望能够将鼠标悬停在框上并让框和链接改变颜色。我可以毫无问题地改变
所以我目前在 Vuejs 中有一个组件,用户可以在其中从他们的本地文件系统中选择一个文件。用户选择图片后,图片会在 div 中预览 codesandbox .出于某种原因,某些图像会自动“翻转”到侧面
我有一个滚动顶部菜单。我正在尝试获取它,以便我的背景图像 (17px x 13px) 悬停在中央。我已经尝试了所有背景 css 属性,但似乎没有任何效果。我是不是用错了方法? 这是我的 CSS: #n
我以前用过这个效果,一切正常(据我所知),但就是不行。我错过了什么? Fiddle here Sprite here 谢谢。 最佳答案 由于您的 Sprite 是水平排列的,因此您需要像这样偏移悬停状
代码后面的代码不起作用,因为重新查找接受字符串作为第一个参数,正则表达式作为第二个参数。 (-> "hello" .toUpperCase (re-find #".$")) 如果我像这
我想使用 CABasicAnimation 翻转 UILabel。动画将永远重复,并将在两个不同值之间更改 UILabel 的文本。 - (void)animateLabel { [self
旋转 WPF 图像非常简单 imgCurrent.LayoutTransform = new RotateTransform(_rotationAngle); 水平和垂直镜像呢? 机外: In GDI
我需要创建一个动画 - 翻转一个 View 并显示另一个。 当前显示的 View 的宽度慢慢减小到零,之后要显示的 View 的宽度必须从零开始增加。 在此期间,高度从当前显示的高度变为略微降低的高度
我正在尝试找到翻转 Rust 中 boolean 值的最快方法?即 false => true true => false 对于我的应用程序,我不关心 boolean 值的当前值,只关心它被翻转了。对
是否可以翻转 primefaces 中的数据表,以使标题位于左侧而不是顶部?我有下表: 如您所见
我在翻转 View 时遇到了一些问题。我的 View Controller 中有以下代码: - (void)loadFlipsideViewController { ProblemViewFl
我正在使用翻转动画在 View Controller 中的两个 View 之间制作动画。问题是动画发生时背景显示白色空白背景。我想显示黑色背景。 我尝试在 IB 和代码中将主视图的背景颜色设置为黑色。
请考虑下面的代码,并告诉我我做错了什么。 我想在两个 UIView 之间切换。 不知何故,当我从初始 View 翻转时,我只是得到翻转的 View ,没有动画。当我向后翻转时,动画显示得很好。 翻转是
我有一个 NSScrollView,需要在其中显示可变数量的 NSView。我制作了一个自定义 NSView,它的 isFlipped 返回 YES 并将我的 NSView 放入其中,然后将其设置为
我有一个 NSView 的子类,它重新实现了许多鼠标事件函数。例如,在 mouseDown 中从我使用的 NSEvent 获取点: NSEvent *theEvent; // <- argument
我是一名优秀的程序员,十分优秀!