Rob*_*ans 5 algorithm image image-processing
给定一个这样的精灵表:
我想写一种算法,可以遍历像素数据并确定每个离散子画面的边界矩形。
如果我们假设对于每个像素X,Y,我可以拉为true(像素不完全透明)或false(像素完全透明),我将如何为每个子图自动生成边界矩形?
结果数据应为具有{x,y,width,height}的矩形对象数组。
这是同一张图片,但前四个精灵的边界标记为浅蓝色:
谁能一步一步介绍如何如上所述检测这些界限?
nat*_*ncy 11
这是一个方法
转换为灰度后,我们通过Otsu的阈值得到二值图像
接下来,我们执行形态变换,将每个精灵合并为单个轮廓
从这里我们找到轮廓,迭代每个轮廓,绘制边界矩形,并提取每个 ROI。这是结果
这是每个保存的精灵 ROI
我已经使用 OpenCV 和 Python 实现了此方法,但您可以将该策略调整为任何语言
import cv2
image = cv2.imread('1.jpg')
original = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
close = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel, iterations=2)
dilate = cv2.dilate(close, kernel, iterations=1)
cnts = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
sprite_number = 0
for c in cnts:
x,y,w,h = cv2.boundingRect(c)
ROI = image[y:y+h, x:x+w]
cv2.imwrite('sprite_{}.png'.format(sprite_number), ROI)
cv2.rectangle(image, (x, y), (x + w, y + h), (36,255,12), 2)
sprite_number += 1
cv2.imshow('thresh', thresh)
cv2.imshow('dilate', dilate)
cv2.imshow('image', image)
cv2.waitKey()
Run Code Online (Sandbox Code Playgroud)