Onu*_*bek 2 python object-detection computer-vision deep-learning yolo
这是来自图像的注释文件:
0 0.6142131979695431 0.336 0.467005076142132 0.392
Run Code Online (Sandbox Code Playgroud)
第一个0是类标签。0.6142131979695431和0.336是边界框的 x 和 y 坐标。0.467005076142132和0.392是边界框的宽度和高度。但是,我不明白的是为什么 x、y、宽度和高度都在 [0,1] 浮点区间内。有人告诉我这是一个百分比,但是相对于什么的百分比呢?
例如,我正在编写构建合成数据集的软件。这是我制作的一张训练图像。它在我想要检测的对象周围有边界框。
边框完美地包裹了 Wizards 和 Ubuntu 徽标。那么,我该如何像上面的格式一样注释它们呢?
| 归档时间: |
|
| 查看次数: |
4991 次 |
| 最近记录: |