使用Keras进行物体检测:更快的R-CNN或YOLO的简单方法

A. *_*tia 13 classification object-detection deep-learning keras

这个问题可能已得到解答,但我没有找到一个简单的答案.我使用Keras创建了一个convnet来对"辛普森一家"字符进行分类(这里是数据集).
我有20个类并给出一个图像作为输入,我返回字符名称.这很简单.我的数据集包含图片中主要字符的图片,并且只有字符的名称作为标签.

现在我想添加一个对象检测问题,即在图片中的字符周围绘制一个边界框并预测它是哪个字符.我不想使用滑动窗口,因为它真的很慢.所以我考虑使用更快的RCNN(github repo)或YOLO(github repo).我是否应该为训练集的每张图片添加边界框的坐标?有没有办法在没有给出训练集的坐标的情况下进行物体检测(并在我的测试中得到边界框)?

总之,我想创建一个简单的对象检测模型,我不知道是否有可能创建一个更简单的YOLO或更快的RCNN.

非常感谢您的帮助.

And*_* Tu 13

yolo或更快的rcnn的目标是获得边界框.所以简而言之,是的,你需要标记数据来训练它.

走捷径:

  • 1)标记一些边界框(假设每个字符5个).
  • 2)在非常小的数据集上训练更快的rcnn或yolo.
  • 3)针对完整数据集运行模型
  • 4)它会得到一些正确的,得到很多错误.
  • 5)训练正确限制的rcnn越快,你的训练集现在应该大得多.
  • 6)重复,直到获得所需的结果.