gpt4 book ai didi

computer-vision - Yolo 或 Faster RCNN 中的 anchor 框或边界框

转载 作者:行者123 更新时间:2023-12-01 13:19:56 26 4
gpt4 key购买 nike

我不知道 anchor 框和边界框或提案区域之间的区别。我对这些定义感到困惑。
而且我不知道检测模型中这些框的含义,因为默认长度永远不会改变!
最后,我混淆了 RCNN 系列和 Yolo 系列都输出预测框位置 (x,y,w,h) 的事实。 .或者输出增量位置(ground truth_x - predicted_x)/prediction_w ?

最佳答案

边界框
边界框是由网络预测的框。这些预测框被覆盖在输入图像上,以便您可以直观地了解预测检测到的矩形的位置和形状。也就是说,它们是您可以在 this youtube video 中看到的矩形。 .

anchor 箱
我们可以对边界框的形状进行一些假设。例如,如果我们想检测人类,我们应该用一些垂直的矩形框来搜索人类。它们是 anchor 盒。在训练和预测之前, anchor 框作为一些数字的列表被馈送到网络,这是一系列宽度和高度对:

anchor = [1.08, 1.19, 3.42, 4.41, 6.63, 11.38, 9.42, 5.11, 16.62, 10.52]

上面的这个列表定义了 5 个 anchor 框。我们可以向网络提供任意数量的 anchor 框。

这些值是通过一些统计程序从训练数据中确定的。

关于computer-vision - Yolo 或 Faster RCNN 中的 anchor 框或边界框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50450998/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com