MobileNet-SSD 输入分辨率

Question

MobileNet-SSD 输入分辨率

che*_*ana 1 object-detection object-detection-api

我有一个工作对象检测模型（经过微调的 MobileNet SSD）可以检测我的自定义小型机器人。我将向它提供一些网络摄像头镜头（将与无人机相关联）并使用实时边界框信息。

所以，我准备买相机。

我的问题：由于 SSD 将输入图像调整为 300x300，因此相机分辨率是否非常重要？更高的分辨率是否意味着更高的准确性（即使它被调整为 300x300）？在运行我的对象检测模型之前，我应该在每一帧将相机素材裁剪成 1:1 的纵横比吗？我应该将图像分成 MxN 裁剪段并一一运行推理吗？

因为我的机器人非常小而且无人机将在 4 米的高度，所以我将有效地尝试检测输入图像上的一个非常小的点。

非常感谢任何形式的智慧，谢谢。

Answer 1

net*_*sam 5

这些问题比较多，我会尽量一一回答。检测模型在将输入图像馈送到网络之前通过一些调整大小的方法（例如双线性）调整输入图像的大小。如果输入图像等于或大于网络的输入大小而不是更小，当然会更好。经验法则是，确实更高的分辨率意味着更高的准确性，但这在很大程度上取决于设置和任务。如果您试图检测一个小物体，例如原始分辨率为 1920x1080。然后在调整图像大小后，小物体会更小（像素级），并且可能太小而无法检测。因此，确实，最好是将图像分割成更小的图像（可能有一些重叠以避免由于对象分割而导致误检测）并在每个图像上应用检测，或者使用具有更高输入分辨率的模型。请注意，虽然您当前的模型可以使用第一个，但您可能需要为后者训练一个新模型，可能会进行一些架构更改（例如，添加 SSD 层和修改锚点，取决于您要检测的比例）。关于纵横比问题，您主要需要保持一致。如果您不保持原始纵横比并不重要，但是如果您不保持 - 在培训和评估/测试/部署中都这样做。需要为后者训练一个新模型，可能需要进行一些架构更改（例如，添加 SSD 层和修改锚点，取决于您要检测的比例）。关于纵横比问题，您主要需要保持一致。如果您不保持原始纵横比并不重要，但是如果您不保持 - 在培训和评估/测试/部署中都这样做。需要为后者训练一个新模型，可能需要进行一些架构更改（例如，添加 SSD 层和修改锚点，取决于您要检测的比例）。关于纵横比问题，您主要需要保持一致。如果您不保持原始纵横比并不重要，但是如果您不保持 - 在培训和评估/测试/部署中都这样做。

归档时间：	6 年，11 月前
查看次数：	2106 次
最近记录：	6 年，10 月前