Sprite Sheet自动检测单个Sprite边界

Rob*_*ans 5 algorithm image image-processing

给定一个这样的精灵表:

精灵表范例

我想写一种算法,可以遍历像素数据并确定每个离散子画面的边界矩形。

如果我们假设对于每个像素X,Y,我可以拉为true(像素不完全透明)或false(像素完全透明),我将如何为每个子图自动生成边界矩形?

结果数据应为具有{x,y,width,height}的矩形对象数组。

这是同一张图片,但前四个精灵的边界标记为浅蓝色:

带边框的精灵表

谁能一步一步介绍如何如上所述检测这些界限?

nat*_*ncy 11

这是一个方法

  • 将图像转换为灰度
  • 获取二值图像的大津阈值
  • 执行形态变换以平滑图像
  • 寻找轮廓
  • 迭代轮廓以绘制边界矩形并提取 ROI

转换为灰度后,我们通过Otsu的阈值得到二值图像

在此输入图像描述

接下来,我们执行形态变换,将每个精灵合并为单个轮廓

在此输入图像描述

从这里我们找到轮廓,迭代每个轮廓,绘制边界矩形,并提取每个 ROI。这是结果

在此输入图像描述

这是每个保存的精灵 ROI

在此输入图像描述

我已经使用 OpenCV 和 Python 实现了此方法,但您可以将该策略调整为任何语言

import cv2

image = cv2.imread('1.jpg')
original = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
close = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel, iterations=2)
dilate = cv2.dilate(close, kernel, iterations=1)

cnts = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

sprite_number = 0
for c in cnts:
    x,y,w,h = cv2.boundingRect(c)
    ROI = image[y:y+h, x:x+w]
    cv2.imwrite('sprite_{}.png'.format(sprite_number), ROI)
    cv2.rectangle(image, (x, y), (x + w, y + h), (36,255,12), 2)
    sprite_number += 1

cv2.imshow('thresh', thresh)
cv2.imshow('dilate', dilate)
cv2.imshow('image', image)
cv2.waitKey()
Run Code Online (Sandbox Code Playgroud)