我试图使用Tensorflow的对象检测API来训练模型.我正在使用更快的rcnn resnet101的示例配置(https://github.com/tensorflow/models/blob/master/object_detection/samples/configs/faster_rcnn_resnet101_voc07.config).
以下代码是我不太了解的配置文件的一部分:
image_resizer {
keep_aspect_ratio_resizer {
min_dimension: 600
max_dimension: 1024
}
}
Run Code Online (Sandbox Code Playgroud)
我的问题是:
min_dimension
and 的确切含义是max_dimension
什么?是否意味着输入图像的大小将调整为600x1024或1024x600?min_dimension
和max_dimension
?我有这样的问题的原因来自这篇文章: TensorFlow对象检测API怪异行为
在这篇文章中,作者自己回答了这个问题:
然后我决定裁剪输入图像并将其作为输入提供.只是为了看看结果是否有所改善而且确实如此!
事实证明,输入图像的尺寸远大于模型所接受的600 x 1024.因此,它将这些图像缩小到600 x 1024,这意味着香烟盒正在丢失它们的细节:)
它使用了我使用的相同配置.我不确定如果这些参数是默认设置或建议设置为此特殊模型,fast_rcnn_resnet101,我是否可以更改这些参数.