小编yuh*_*566的帖子

使用对象检测api的默认配置时,不同尺寸的图像缩放器的影响是什么

我试图使用Tensorflow的对象检测API来训练模型.我正在使用更快的rcnn resnet101的示例配置(https://github.com/tensorflow/models/blob/master/object_detection/samples/configs/faster_rcnn_resnet101_voc07.config).
以下代码是我不太了解的配置文件的一部分:

image_resizer {
  keep_aspect_ratio_resizer {
    min_dimension: 600
    max_dimension: 1024
  }
}
Run Code Online (Sandbox Code Playgroud)

我的问题是:

  1. min_dimensionand 的确切含义是max_dimension什么?是否意味着输入图像的大小将调整为600x1024或1024x600?
  2. 如果我有图像的大小不同,也许他们中的一些比600x1024(或1024×600)相对较大,可以/我应该增加的价值min_dimensionmax_dimension

我有这样的问题的原因来自这篇文章: TensorFlow对象检测API怪异行为

在这篇文章中,作者自己回答了这个问题:

然后我决定裁剪输入图像并将其作为输入提供.只是为了看看结果是否有所改善而且确实如此!
事实证明,输入图像的尺寸远大于模型所接受的600 x 1024.因此,它将这些图像缩小到600 x 1024,这意味着香烟盒正在丢失它们的细节:)

它使用了我使用的相同配置.我不确定如果这些参数是默认设置或建议设置为此特殊模型,fast_rcnn_resnet101,我是否可以更改这些参数.

object-detection tensorflow

6
推荐指数
1
解决办法
4408
查看次数

标签 统计

object-detection ×1

tensorflow ×1