对象检测API的图像大小

Question

是否有运行对象检测API中可用的对象检测网络的最佳大小？该API似乎可以接受所有大小的图像，但是我不清楚在传送到网络之前哪种类型以及如何缩放图像。你能澄清一下吗？

谢谢！

Answer 1

答案取决于您正在运行的模型。对于我们的 SSD 型号，我们会将图像重塑为 300x300 像素。对于 FasterRCNN 或 RFCN，我们将在 600-1024 像素之间重塑。

用户应添加到 TFRecord 中的图像可以是任何大小，但我们建议用户保持尽可能小（即，SSD 每维最大 ~400-600px，或 FasterRCNN 或 R-FCN 每维最大 ~1500px）出于记忆原因。

但是简单的调整大小会扭曲所有输入图像（更多一些，一些更少），这不会对检测质量产生负面影响吗？我对此感到困惑有一段时间了，您可能是该问的合适人选 :) (3认同)
大型卫星图像（例如 6000x4000）的最佳实践是什么，您希望在图像中进行连续特征框识别？ (2认同)

Answer 2

有一个脚本称为preprocessor_builder负责。因此，每当将映像馈送到网络时，它都必须经过此预处理，并确保根据网络配置文件正确调整映像的大小以匹配网络。

实际的调整大小在这里发生。