gpt4 book ai didi

machine-learning - 神经网络输出中的边界框估计

转载 作者:行者123 更新时间:2023-11-30 09:01:05 26 4
gpt4 key购买 nike

我正在研究卷积神经网络来识别动物、车辆、树木等物体。检测类别之一是汽车。当我将图像提供给网络时,它预测为 auto 。但我需要在对象周围绘制一个边界框。当我尝试滑动窗口方式时,我得到了很多边界框,但我只需要一个。神经网络预测后如何找出物体最合适的边界框?我们不需要某种方法来定位大图像中的对象吗?这就是我想要的。

我的最后一层函数是逻辑回归函数,它仅预测 1 或 0。我不知道如何对概率分数进行预测。如果我有每个盒子的概率分数,那么很容易找到最合适的盒子。请建议我一些找到相同内容的方法。提前致谢。欢迎所有答案。

INPUT, OUTPUT AND EXPECTED OUTPUT

最佳答案

尚不清楚输入图像中是否有单个对象或多个对象。您的示例显示了一个。

如果您有一个对象,请考虑以下一些边界框选项:

  • 保留最远的边界:保留距离所有边界框中心最远的顶部、底部、右、左边界。
  • 保留平均水平:例如获取所有顶部边界并保留它们的平均位置。对所有底部、右侧和左侧边界重复相同的操作。
  • 保留中值:与平均值相同,但保留每个方向边界的中值。
  • 保留具有最大激活值的边界框:您将使用逻辑回归作为最后一步,找到进入该逻辑层的输入,并将具有最大输入的边界框保留为物流层。

关于machine-learning - 神经网络输出中的边界框估计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37026438/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com