更快 - RCNN评估

Tan*_*vir 3 caffe conv-neural-network pycaffe

我正在INRIA Person数据集上培训Faster-RCNN(VGG-16架构).我接受了180,000个训练步骤的训练.但是当我评估网络时,它会给出相同图像的不同结果.以下是图片第一次评估

第二次评估

第三次评估

我不确定为什么它会为同一组权重给出不同的结果.网络是用caffe实现的.对此问题的任何见解都非常感谢.

下图显示了不同的网络损失 在此输入图像描述

Rya*_*Liu 5

最近,我还准备了自己的训练数据集,并得到了与你相似的结果.

以下是我的经历并与您分享:

  1. 检查输入格式包括图像和你的边界框csvfile或xml(总是放在Annotation文件中)是否所有边界框(x1,y1,x2,y2)都正确?

  2. 然后检查roidb/imdb加载python脚本(放在FasterRCNN/lib/datasets/pascal_roi.py,也许你的是inria.py),确保_load_xxx_annotation()通过print bounding_box和filename正确加载所有边界框.重要的是,如果您的脚本被复制并修改了pascal_roi.py或任何原型脚本,请检查它是否将所有roi和图像信息保存到缓存文件中,如果是,则需要在更改任何配置文件时删除该缓存文件并重新启动-尝试.

  3. 最后,确保在网络训练时正确生成所有边界框(例如,打印minibatch变量以显示文件名,并在FasterRCNN/lib/roi_data_layer/layer.py中显示相应的x1,y1,x2,y2).如果正确生成roi生成器,则边界框与手动选择的边界框大不相同.

一些类似的问题也可能导致这个问题.