gpt4 book ai didi

deep-learning - 使用 Keras : simple way for faster R-CNN or YOLO 的对象检测

转载 作者:行者123 更新时间:2023-12-03 23:35:05 26 4
gpt4 key购买 nike

这个问题可能已经得到回答,但我没有找到一个简单的答案。我使用 Keras 创建了一个 convnet 来对辛普森一家的角色进行分类 ( dataset here )。
我有 20 个类并给出一个图像作为输入,我返回字符名称。这很简单。我的数据集包含图片中带有主角的图片,并且只有字符的名称作为标签。

现在我想添加一个对象检测问题,即在图片中的字符周围绘制一个边界框并预测它是哪个字符。我不想使用滑动窗口,因为它真的很慢。所以我考虑使用更快的 RCNN ( github repo ) 或 YOLO ( github repo )。我是否必须为训练集的每张图片添加边界框的坐标?有没有办法在不提供训练集坐标的情况下进行对象检测(并在我的测试中获得边界框)?

总而言之,我想创建一个简单的对象检测模型,不知道是否可以创建一个更简单的YOLO或Faster RCNN。

非常感谢您的帮助。

最佳答案

yolo 或 fast rcnn 的目标是获取边界框。简而言之,是的,您需要标记数据以对其进行训练。

走捷径:

  • 1) 标记一些边界框(假设每个字符 5 个)。
  • 2) 在非常小的数据集上训练更快的 rcnn 或 yolo。
  • 3) 针对完整数据集运行模型
  • 4)它会得到一些正确的,得到很多错误。
  • 5)在正确有界的那些上训练更快的rcnn,你的
    训练集现在应该更大了。
  • 6)重复直到你得到你想要的结果。
  • 关于deep-learning - 使用 Keras : simple way for faster R-CNN or YOLO 的对象检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44687230/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com