快速 rcnn 对象检测中的误报

Rep*_*lsr 5 object-detection deep-learning tensorflow

我正在使用 tensorflow 和faster_rcnn_inception_v2_coco模型训练对象检测器,并且在对视频进行分类时遇到了很多误报。

经过一些研究,我发现我需要在训练过程中添加负面图像。

如何将这些添加到tfrecord文件中?我用的CSVtfrecord教程提供的文件的代码在这里

此外,似乎 ssdhard_example_miner的配置中有一个允许配置此行为,但对于更快的 rcnn 似乎并非如此?有没有办法在更快的 rcnn 上实现类似的目标?

小智 5

我在使用更快的 RCNN 时遇到了同样的问题,尽管您实际上不能将 hard_example_miner更快的 RCNN模型一起使用,但您可以添加一些背景图像,即。没有对象的图像(一切都保持不变,除了那个特定图片的 xml 中没有对象标签)

另一件对我来说真的很神奇的事情是使用imgaug,您可以使用相同的脚本扩充图像和边界框。尝试将训练数据增加 10 或 15 倍,然后我建议您再次训练到 150000-200000 步左右。

这两个步骤帮助我有效地减少了误报的数量。