gpt4 book ai didi

computer-vision - 使用 K 均值聚类生成 anchor 框,YOLO

转载 作者:行者123 更新时间:2023-12-01 22:43:12 24 4
gpt4 key购买 nike

我试图了解 YOLO 的工作原理以及它如何检测图像中的对象。我的问题是,k 均值聚类在检测对象周围的边界框方面​​发挥什么作用?谢谢。

最佳答案

K-means聚类算法是数据科学中非常著名的算法。该算法的目的是将n个观察结果划分为k个集群。主要包括:

  1. 初始化:K 表示(即质心)随机生成。
  2. 作业:通过将每个观测值与最近的质心相关联来形成聚类。

  3. 更新集群:新创建的集群的质心变得平均。

赋值和更新会重复发生,直到收敛。最终结果是点与其各自质心之间的误差平方和最小。

编辑:

Why use K means

  1. 与其他无监督学习算法相比,K-means 的计算速度更快、效率更高。不要忘记时间复杂度是线性的。
  2. 它产生比层次聚类更高的聚类。更多的簇数量有助于获得更准确的最终结果。
  3. 当重新计算质心时,实例可以更改集群(移动到另一个集群)。
  4. 即使您的某些假设被打破,效果也很好。

what it really does in determining anchor box

  1. 它将为每个表示形状、位置、大小等的预测变量创建数千个 anchor 框(即 k 均值中的聚类)。
  2. 对于每个 anchor 框,计算哪个对象的边界框具有最高重叠度除​​以非重叠度。这称为并集交集或 IOU。
  3. 如果最高 IOU 大于 50%(可以自定义),则告诉 anchor 框应该检测具有最高 IOU 的对象。
  4. 否则,如果 IOU 大于 40%,则告诉神经网络真实的检测是不明确的,并且不要从该示例中学习。
  5. 如果最高 IOU 低于 40%,则应该预测不存在对象。

谢谢!

关于computer-vision - 使用 K 均值聚类生成 anchor 框,YOLO,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56442413/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com