如何将 Yolo 格式的边界框坐标转换为 OpenCV 格式

aru*_*836 6 python opencv yolo

我有Yolo保存在.txt文件中的对象的格式边界框注释。现在我想加载这些坐标并使用 将其绘制在图像上OpenCV,但我不知道如何将这些浮点值转换为OpenCV格式坐标值

我尝试了这篇文章,但没有帮助,下面是我正在尝试做的示例示例

代码和输出

import matplotlib.pyplot as plt
import cv2

img = cv2.imread(<image_path>)
dh, dw, _ = img.shape
        
fl = open(<label_path>, 'r')
data = fl.readlines()
fl.close()
        
for dt in data:
            
    _, x, y, w, h = dt.split(' ')
            
    nx = int(float(x)*dw)
    ny = int(float(y)*dh)
    nw = int(float(w)*dw)
    nh = int(float(h)*dh)
            
    cv2.rectangle(img, (nx,ny), (nx+nw,ny+nh), (0,0,255), 1)
            
plt.imshow(img)
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

实际注释和图像

0 0.286972 0.647157 0.404930 0.371237 
0 0.681338 0.366221 0.454225 0.418060
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

Han*_*rse 19

还有另外一个Q&A关于这个主题,而且有这个1个公认的答案如下有趣的评论。最重要的是,YOLO 坐标与图像具有不同的居中位置。不幸的是,评论员没有提供 Python 端口,所以我在这里做了:

import cv2
import matplotlib.pyplot as plt

img = cv2.imread(<image_path>)
dh, dw, _ = img.shape

fl = open(<label_path>, 'r')
data = fl.readlines()
fl.close()

for dt in data:

    # Split string to float
    _, x, y, w, h = map(float, dt.split(' '))

    # Taken from https://github.com/pjreddie/darknet/blob/810d7f797bdb2f021dbe65d2524c2ff6b8ab5c8b/src/image.c#L283-L291
    # via https://stackoverflow.com/questions/44544471/how-to-get-the-coordinates-of-the-bounding-box-in-yolo-object-detection#comment102178409_44592380
    l = int((x - w / 2) * dw)
    r = int((x + w / 2) * dw)
    t = int((y - h / 2) * dh)
    b = int((y + h / 2) * dh)
    
    if l < 0:
        l = 0
    if r > dw - 1:
        r = dw - 1
    if t < 0:
        t = 0
    if b > dh - 1:
        b = dh - 1

    cv2.rectangle(img, (l, t), (r, b), (0, 0, 255), 1)

plt.imshow(img)
plt.show()
Run Code Online (Sandbox Code Playgroud)

因此,对于某些 Lenna 图像,这将是输出,我认为它显示了您的图像的正确坐标:

输出

----------------------------------------
System information
----------------------------------------
Platform:     Windows-10-10.0.16299-SP0
Python:       3.8.5
Matplotlib:   3.3.2
OpenCV:       4.4.0
----------------------------------------
Run Code Online (Sandbox Code Playgroud)

1请为链接的答案和评论点赞。


nul*_*ull 6

有一种更直接的方法可以使用pybboxes来做这些事情。安装,

pip install pybboxes
Run Code Online (Sandbox Code Playgroud)

就你而言,

import pybboxes as pbx

yolo_bbox1 = (0.286972, 0.647157, 0.404930, 0.371237)
yolo_bbox2 = (0.681338, 0.366221, 0.454225, 0.418060)
W, H = 300, 300  # WxH of the image
pbx.convert_bbox(yolo_bbox1, from_type="yolo", to_type="voc", image_size=(W, H))
>>> (25, 138, 147, 250)
pbx.convert_bbox(yolo_bbox2, from_type="yolo", to_type="voc", image_size=(W, H))
>>> (136, 47, 273, 173)
Run Code Online (Sandbox Code Playgroud)

请注意,转换为 YOLO 格式需要图像宽度和高度进行缩放。

  • 非常感谢朋友。你节省了我很多时间 (2认同)