che*_*ana 1 object-detection object-detection-api
我有一个工作对象检测模型(经过微调的 MobileNet SSD)可以检测我的自定义小型机器人。我将向它提供一些网络摄像头镜头(将与无人机相关联)并使用实时边界框信息。
所以,我准备买相机。
我的问题:由于 SSD 将输入图像调整为 300x300,因此相机分辨率是否非常重要?更高的分辨率是否意味着更高的准确性(即使它被调整为 300x300)?在运行我的对象检测模型之前,我应该在每一帧将相机素材裁剪成 1:1 的纵横比吗?我应该将图像分成 MxN 裁剪段并一一运行推理吗?
因为我的机器人非常小而且无人机将在 4 米的高度,所以我将有效地尝试检测输入图像上的一个非常小的点。
非常感谢任何形式的智慧,谢谢。
这些问题比较多,我会尽量一一回答。检测模型在将输入图像馈送到网络之前通过一些调整大小的方法(例如双线性)调整输入图像的大小。如果输入图像等于或大于网络的输入大小而不是更小,当然会更好。经验法则是,确实更高的分辨率意味着更高的准确性,但这在很大程度上取决于设置和任务。如果您试图检测一个小物体,例如原始分辨率为 1920x1080。然后在调整图像大小后,小物体会更小(像素级),并且可能太小而无法检测。因此,确实,最好是将图像分割成更小的图像(可能有一些重叠以避免由于对象分割而导致误检测)并在每个图像上应用检测,或者使用具有更高输入分辨率的模型。请注意,虽然您当前的模型可以使用第一个,但您可能需要为后者训练一个新模型,可能会进行一些架构更改(例如,添加 SSD 层和修改锚点,取决于您要检测的比例)。关于纵横比问题,您主要需要保持一致。如果您不保持原始纵横比并不重要,但是如果您不保持 - 在培训和评估/测试/部署中都这样做。需要为后者训练一个新模型,可能需要进行一些架构更改(例如,添加 SSD 层和修改锚点,取决于您要检测的比例)。关于纵横比问题,您主要需要保持一致。如果您不保持原始纵横比并不重要,但是如果您不保持 - 在培训和评估/测试/部署中都这样做。需要为后者训练一个新模型,可能需要进行一些架构更改(例如,添加 SSD 层和修改锚点,取决于您要检测的比例)。关于纵横比问题,您主要需要保持一致。如果您不保持原始纵横比并不重要,但是如果您不保持 - 在培训和评估/测试/部署中都这样做。
| 归档时间: |
|
| 查看次数: |
2106 次 |
| 最近记录: |