gpt4 book ai didi

machine-learning - 为什么旋转不变神经网络没有用于流行比赛的获胜者?

转载 作者:行者123 更新时间:2023-11-30 08:20:56 25 4
gpt4 key购买 nike

众所周知,现代最流行的 CNN(卷积神经网络):VGG/ResNet (FasterRCNN)、SSD、Yolo、Yolo v2、DenseBox、DetectNet - 不是旋转不变的:Are modern CNN (convolutional neural network) as DetectNet rotate invariant?

众所周知,有几种具有旋转不可变对象(immutable对象)检测功能的神经网络:

  1. 旋转不变 Neoperceptron 2006 ( PDF ): https://www.researchgate.net/publication/224649475_Rotation-Invariant_Neoperceptron

  2. 学习用于纹理分类的旋转不变卷积滤波器 2016 ( PDF ): https://arxiv.org/abs/1604.06720

  3. RIFD-CNN:用于目标检测的旋转不变和 Fisher 判别卷积神经网络 2016 ( PDF ): http://www.cv-foundation.org/openaccess/content_cvpr_2016/html/Cheng_RIFD-CNN_Rotation-Invariant_and_CVPR_2016_paper.html

  4. 卷积神经网络中的编码不变性 2014 ( PDF )

  5. 用于星系形态预测的旋转不变卷积神经网络(PDF):https://arxiv.org/abs/1503.07077

  6. 学习用于 VHR 光学遥感图像中目标检测的旋转不变卷积神经网络 2016:http://ieeexplore.ieee.org/document/7560644/

我们知道,在 IMAGE-NET、MSCOCO、PASCAL VOC 等图像检测竞赛中,使用了网络集成(同时使用了一些神经网络)。或者单个网络中的网络集成,例如 ResNet ( Residual Networks Behave Like Ensembles of Relatively Shallow Networks )

但是像 MSRA 这样的获胜者是否使用了旋转不变网络集成,如果没有,那么为什么?为什么在集成中附加的旋转不变网络不会增加检测某些物体(例如飞机物体)的准确性 - 哪些图像是在不同的旋转角度完成的?

它可以是:

  • 从地面拍摄的飞机物体 enter image description here

  • 或从空中拍摄的地面物体 enter image description here

为什么旋转不变神经网络没有用于流行的目标检测竞赛的获胜者?

最佳答案

图像识别领域的最新进展主要是通过将方法从经典的特征选择 - 浅层学习算法改变为无特征选择 - 深度学习算法来实现的。这仅是由卷积神经网络的数学特性引起的。是的 - 当然,它们使用较少数量的参数捕获相同信息的能力部分是由它们的平移不变性引起的,但最近的research已经表明这并不是理解他们成功的关键。

在我看来,这一成功背后的主要原因是开发更快的学习算法,而不是数学上更准确的学习算法,这就是为什么较少关注开发另一种属性不变的神经网络。

当然 - 旋转不变性根本不会被跳过。这部分是通过数据增强实现的,您可以将稍微改变的(例如旋转或重新缩放)图像放入数据集中 - 使用相同的标签。正如我们可以在本文fantastic book中读到的那样这两种方法(更多结构更少结构+数据增强)或多或少是等效的。 (第 5.5.3 章,标题:不变性)

关于machine-learning - 为什么旋转不变神经网络没有用于流行比赛的获胜者?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41069903/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com