gpt4 book ai didi

computer-vision - 高 mAP@50,但精度和召回率低。这是什么意思,什么指标应该更重要?

转载 作者:行者123 更新时间:2023-12-04 14:39:47 25 4
gpt4 key购买 nike

我正在比较用于海上搜救 (SAR) 目的的物体检测模型。从我使用的模型中,我在 YOLOv3 的改进版本中获得了最好的结果,用于小物体检测和 FASTER RCNN。
对于 YOLOv3,我得到了最好的 mAP@50,但是对于 FASTER RCNN,我得到了更好的所有其他指标(精度、召回率、F1 分数)。现在我想知道如何阅读它以及在这种情况下哪个模型真的更好?
enter image description here
我想补充一点,数据集中只有两个类:小对象和大对象。我们选择这个解决方案是因为对我们来说,对象在类别之间的区别不像检测任何人类起源的对象那么重要。
然而,小物体并不意味着小的 GT 边界框。这些是实际面积很小的物体 - 小于 2 平方米(例如人、浮标)。大物体是面积较大的物体(小船、轮船、独木舟等)。
以下是每个类别的结果:
enter image description here
以及来自数据集的两个示例图像(使用 YOLOv3 检测):
enter image description here
enter image description here

最佳答案

对象检测的 mAP 是为所有类计算的 AP 的平均值。 mAP@0.5 表示是在 IOU 阈值 0.5 下计算的 mAP。
平均精度 (AP) 的一般定义是找到精度-召回曲线下的面积。
绘制模型的精度和召回率作为模型置信阈值的函数的过程是精度召回曲线。
精度衡量您的预测的准确程度。即您的预测正确的百分比。召回衡量您发现所有积极因素的程度。 F1 分数是准确率和召回率的 HM(谐波均值)。
现在回答你的问题。
如何阅读它以及在这种情况下哪个模型真的更好?

  • mAP 是衡量神经网络灵敏度的一个很好的指标。如此好的 mAP 表明模型在不同置信度阈值上是稳定且一致的。在您的情况下,更快的 rcnn 结果表明与 Yolov3 相比,精确召回曲线指标很差,这意味着与 Yolov3 相比,更快的 rcnn 在较高置信阈值下召回率非常差,或者在较低置信度阈值下精度非常差(尤其是小 object )。
  • 为给定的置信度阈值计算精度、召回率和 F1 分数。我假设您正在使用默认置信阈值(可能是 0.25)运行模型。因此,更快的 rcnn 具有更高的精度、召回率和 F1 分数表明,在该置信度阈值下,与 Yolov3 相比,它在所有 3 个指标方面都更好。

  • 什么指标应该更重要?
    一般来说,为了分析性能更好的模型,我建议您使用验证集(用于调整超参数的数据集)和测试集(用于评估完全训练模型性能的数据集)。
    注:FP - 假阳性 FN - 假阴性
    在验证集上:
  • 使用 mAP 从迭代/时期的所有训练权重中选择性能最佳的模型(更稳定和一致的模型)。使用 mAP 了解是否应该进一步训练/调整模型。
  • 检查类级别的 AP 值以确保模型在各个类中稳定且良好。
  • 根据用例/应用程序,如果您完全容忍 FN 而对 FP 高度不容忍,那么相应地使用 Precision 训练/调整模型。
  • 根据用例/应用程序,如果您完全容忍 FP 并且对 FN 高度不容忍,那么相应地使用 Recall 训练/调整模型。

  • 在测试集上:
  • 如果您对 FP 和 FN 持中立态度,则使用 F1 分数来评估最佳性能模型。
  • 如果您不接受 FP(不太关心 FN),请选择精度更高的模型
  • 如果您不接受 FN(不太关心 FP),请选择召回率较高的模型
  • 一旦你决定了你应该使用的指标,就为给定的模型尝试多个置信阈值(例如 - 0.25、0.35 和 0.5),以了解您选择的指标对哪个置信阈值有利,并了解可接受的权衡范围(假设您想要至少 80% 的精度和一些不错的召回率)。一旦确定了置信阈值,您就可以在不同的模型中使用它来找出性能最佳的模型。
  • 关于computer-vision - 高 mAP@50,但精度和召回率低。这是什么意思,什么指标应该更重要?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62973155/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com