gpt4 book ai didi

deep-learning - 快速RCNN-ROI预测

转载 作者:行者123 更新时间:2023-12-03 16:26:58 25 4
gpt4 key购买 nike

在快速RCNN方法中,原始图像中的区域提议被投影到最终卷积特征图的输出上。对于VGG网络,输入图像的大小为224 x 244,卷积特征图的最终输出为14 x 14 x 512。

这是否意味着将输入图像上的建议投影到特征图上以进行ROI合并?投影是对边界框的简单缩放吗?

最佳答案

本文对RoI池以及如何从原始标签中获得等效的RoI BB进行了很好的描述。
https://medium.com/datadriveninvestor/review-on-fast-rcnn-202c9eadd23b
RoI池的基本目的是从CNN输出特征图的任意大小部分输出固定大小的特征图。
为此,您必须进行RoI投影才能将RoI BB(x,y,h,w)从原始图像转换为功能图中所需的RoI BB。这是通过根据子采样率对其进行缩放来完成的。
前任。)

  • 如果图像为18x18,特征图为3x3,则子采样率为3/18。
  • 要获得预计的RoI BB,请将该值乘以原始BB值,例如x'=(3/18)x

  • 然后,您只需在要素 map 的该部分上进行池化,并使用H×W个池化窗口,大小为〜h'/H×w'/W,其中H和W是目标输出的高度和宽度。池化层。
    这篇文章提供了更好的描述,我鼓励您检查一下它和原始论文!

    关于deep-learning - 快速RCNN-ROI预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40925052/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com