gpt4 book ai didi

python - 物体只占图像一小部分的物体检测

转载 作者:行者123 更新时间:2023-12-02 00:47:21 25 4
gpt4 key购买 nike

我训练了一个路标检测网络。在训练数据中,标志占据了整个框架,像这样:

Training image example

但是在我想用于预测的图像中,路标占据的空间要小得多,例如:

Actual data example

对此类图像的预测不是很好,但是如果我只裁剪到符号,则预测很好。

我如何着手为较大的图像生成预测?

不幸的是,我未能在类似问题中找到答案。

最佳答案

当您想扩展对单个标志的分类以“检测”它们并在更大的图像中对它们进行分类时,这听起来像是您在尝试解决不同类型的问题。

您(至少)有几个选择:

  • 创建扫描图像的滑动窗口并对每个步骤进行分类。这样,当您点击标志时,它将返回一个好的分类。但是您很快就会意识到这不是很实用或效率很高。窗口大小和步长成为需要优化的更多参数,正如您将在以下选项中看到的那样,已经有一些特定于对象检测的方法已尝试解决此特定问题。
  • 您可以尝试对象检测架构。这将要求您提出一个不同于您在图像分类中使用的训练数据集。您将需要许多(成百上千个)包含(在某些情况下不包含)您要识别的标志的图像“大”版本。您需要一个注释工具来定位和标记这些标志,然后您可以训练网络来定位和标记它们。

要查找第二个选项的一些架构包括:YOLO、单次检测 (SSD)、Faster RCNN 等等。

关于python - 物体只占图像一小部分的物体检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60850448/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com