在张量流模型中使用更快的RCNN进行小物体检测

Ben*_*bey 8 object-detection tensorflow

我正在尝试为小数字检测训练一个更快的rccn模型.我正在使用新发布的tensorflow 对象检测API,到目前为止已经从动物园中对预先训练好的faster_rcnn_resnet101_coco进行了微调.我所有的训练尝试都产生了高精度但低召回率的模型.在每个图像上的~120个对象(数字)中,仅检测到~20个对象,但是当检测到时,分类是准确的.(此外,我能够在我的裁剪图像上从头开始训练一个简单的回旋网,具有高精度,因此问题出在模型的检测方面.)原始图像中每个数字平均为60x30(可能大约是原始图像的一半)在将图像调整到模型之前调整图像之后.)以下是一个示例图像,其中包含我所看到的检测到的框: 在此输入图像描述

对我来说奇怪的是它如何能够正确地检测相邻数字但完全错过了在像素尺寸方面非常相似的其余数字.

我已经尝试围绕锚箱生成调整超参数,first_stage_max_proposals但到目前为止还没有改进结果.这是我使用的示例配置文件.我应该尝试调整哪些其他超参数?关于如何诊断问题的任何其他建议?我是否应该研究其他架构,或者使用更快的rccn和/或SSD来完成我的任务?

Ben*_*bey 8

最后,直接的问题是我没有正确使用可视化工具.通过更新visualize_boxes_and_labels_on_image_arrayJohnathan在评论中描述的参数,我能够看到我至少检测到比我想象的更多的盒子.

  • 除了能够看到更多的边界框之外,您的模型在查找小物体方面是否有所改进?我正在研究在大图像(1920 x 1080)上检测小物体(55 x 15像素)。训练后,我很难在图像上找到任何东西(我已经尝试了所有预先训练的模型,但都没有产生好的结果),这与您在问题中显示的图像相似。 (2认同)