YOLOv4注释将维度保存在[0,1]浮点区间中

Onu*_*bek 2 python object-detection computer-vision deep-learning yolo

这是来自图像的注释文件:

0 0.6142131979695431 0.336 0.467005076142132 0.392
Run Code Online (Sandbox Code Playgroud)

第一个0是类标签。0.61421319796954310.336是边界框的 x 和 y 坐标。0.4670050761421320.392是边界框的宽度和高度。但是,我不明白的是为什么 x、y、宽度和高度都在 [0,1] 浮点区间内。有人告诉我这是一个百分比,但是相对于什么的百分比呢?

例如,我正在编写构建合成数据集的软件。这是我制作的一张训练图像。它在我想要检测的对象周围有边界框。

在此输入图像描述

边框完美地包裹了 Wizards 和 Ubuntu 徽标。那么,我该如何像上面的格式一样注释它们呢?

Abh*_*25t 5

YOLO格式中的宽度/高度是整个图像总宽度/高度的分数。因此,无论图像大小如何,左上角始终为 (0,0),右下角始终为 (1,1)。

有关边界框 (x1, y1, x2, y2) 到 YOLO 样式 (x, y, w, h) 的转换,请参阅此问题。

在此输入图像描述