对象检测API的图像大小

use*_*420 3 object-detection tensorflow

是否有运行对象检测API中可用的对象检测网络的最佳大小?该API似乎可以接受所有大小的图像,但是我不清楚在传送到网络之前哪种类型以及如何缩放图像。你能澄清一下吗?

谢谢!

Der*_*how 5

答案取决于您正在运行的模型。对于我们的 SSD 型号,我们会将图像重塑为 300x300 像素。对于 FasterRCNN 或 RFCN,我们将在 600-1024 像素之间重塑。

用户应添加到 TFRecord 中的图像可以是任何大小,但我们建议用户保持尽可能小(即,SSD 每维最大 ~400-600px,或 FasterRCNN 或 R-FCN 每维最大 ~1500px)出于记忆原因。

  • 但是简单的调整大小会扭曲所有输入图像(更多一些,一些更少),这不会对检测质量产生负面影响吗?我对此感到困惑有一段时间了,您可能是该问的合适人选 :) (3认同)
  • 大型卫星图像(例如 6000x4000)的最佳实践是什么,您希望在图像中进行连续特征框识别? (2认同)

Ult*_*let 5

有一个脚本称为preprocessor_builder负责。因此,每当将映像馈送到网络时,它都必须经过此预处理,并确保根据网络配置文件正确调整映像的大小以匹配网络。

实际的调整大小在这里发生。