gpt4 book ai didi

tensorflow - YOLO 物体检测 : how does the algorithm predict bounding boxes larger than a grid cell?

转载 作者:行者123 更新时间:2023-12-04 18:20:10 25 4
gpt4 key购买 nike

我试图更好地了解 YOLO2 和 3 算法的工作原理。该算法处理一系列卷积,直到它下降到 13x13 网格。然后它能够​​对每个网格单元内的对象以及这些对象的边界框进行分类。

enter image description here

如果您查看此图片,您会看到红色的边界框比任何单个网格单元格都大。此外,边界框以对象的中心为中心。

我的问题是当网络激活基于单个网格单元时,预测的边界框如何超过网格单元的大小。我的意思是网格单元之外的所有东西对于预测在该单元格中检测到的对象的边界框的神经元来说应该是未知的。

更准确地说,这是我的问题:

1.算法如何预测大于网格单元的边界框?

2.算法如何知道对象的中心位于哪个单元格中?

最佳答案

everything outside of the grid cell should be unknown to the neurons predicting the bounding boxes for an object detected in that cell right.



这不太对。细胞对应于图像的一个分区,如果对象的中心位于其中,神经元已经学会了做出响应。

然而,这些输出神经元的感受野比细胞大得多,实际上覆盖了整个图像。因此,它能够识别并围绕比其指定的“中心单元格”大得多的对象绘制边界框。

所以一个细胞以输出神经元的感受野的中心为中心,但它是一个小得多的部分。它也有点随意,例如可以想象具有重叠的细胞——在这种情况下,当一个物体位于其细胞重叠区域的中心时,您会期望相邻的神经元同时激发。

关于tensorflow - YOLO 物体检测 : how does the algorithm predict bounding boxes larger than a grid cell?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50575301/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com