图像中的正方形检测

fla*_*ite 4 python opencv image image-processing computer-vision

我正在尝试检测所有方形骰子图像,以便我可以单独裁剪它们并将其用于OCR。以下是原始图片:

image3 图4

这是我得到的代码,但缺少一些正方形。

def find_squares(img):
    img = cv2.GaussianBlur(img, (5, 5), 0)
    squares = []
    for gray in cv2.split(img):
        for thrs in range(0, 255, 26):
            if thrs == 0:
                bin = cv2.Canny(gray, 0, 50, apertureSize=5)
                bin = cv2.dilate(bin, None)
            else:
                _retval, bin = cv2.threshold(gray, thrs, 255, cv2.THRESH_BINARY)
            bin, contours, _hierarchy = cv2.findContours(bin, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
            for cnt in contours:
                cnt_len = cv2.arcLength(cnt, True)
                cnt = cv2.approxPolyDP(cnt, 0.02*cnt_len, True)
                if len(cnt) == 4 and cv2.contourArea(cnt) > 1000 and cv2.isContourConvex(cnt):
                    cnt = cnt.reshape(-1, 2)
                    max_cos = np.max([angle_cos( cnt[i], cnt[(i+1) % 4], cnt[(i+2) % 4] ) for i in range(4)])
                    #print(cnt)
                    a = (cnt[1][1] - cnt[0][1])

                    if max_cos < 0.1 and a < img.shape[0]*0.8:

                        squares.append(cnt)
    return squares

dice = cv2.imread('img1.png')
squares = find_squares(dice)
cv2.drawContours(dice, squares, -1, (0, 255, 0), 3)
Run Code Online (Sandbox Code Playgroud)

以下是输出图像: 图片1图片2

根据我的分析,由于骰子和背景之间的平滑强度过渡,由于缺少沿骰子的Canny边缘,因此缺少一些正方形。

鉴于正方形网格图案(5 * 5)中始终有25个骰子的约束,我们能否基于已识别的正方形来预测丢失的正方形位置?还是可以将上述算法修改为平方检测算法?

nat*_*ncy 5

这是一种方法

  • 将图像转换为灰度,将中值模糊转换为平滑图像
  • 锐化图像以增强边缘
  • 执行形态转换
  • 查找轮廓并使用最小/最大阈值区域进行过滤
  • 裁剪并保存ROI

用放大图像cv2.filter2D()。我们使用通用的锐化内核,其他内核可以在这里找到

在此处输入图片说明

现在是获得二进制图像的阈值

在此处输入图片说明

执行形态学操作

在此处输入图片说明

从这里我们找到轮廓,并使用cv2.contourArea()最小/最大阈值区域进行过滤。

在此处输入图片说明

我们可以使用Numpy切片来裁剪每个所需的正方形区域,并像这样保存每个ROI

x,y,w,h = cv2.boundingRect(c)
ROI = image[y:y+h, x:x+h]
cv2.imwrite('ROI_{}.png'.format(image_number), ROI)
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

import cv2
import numpy as np

image = cv2.imread('1.png')

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blur = cv2.medianBlur(gray, 5)
sharpen_kernel = np.array([[-1,-1,-1], [-1,9,-1], [-1,-1,-1]])
sharpen = cv2.filter2D(blur, -1, sharpen_kernel)

thresh = cv2.threshold(sharpen,160,255, cv2.THRESH_BINARY_INV)[1]
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
close = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel, iterations=2)

cnts = cv2.findContours(close, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

min_area = 100
max_area = 1500
image_number = 0
for c in cnts:
    area = cv2.contourArea(c)
    if area > min_area and area < max_area:
        x,y,w,h = cv2.boundingRect(c)
        ROI = image[y:y+h, x:x+h]
        cv2.imwrite('ROI_{}.png'.format(image_number), ROI)
        cv2.rectangle(image, (x, y), (x + w, y + h), (36,255,12), 2)
        image_number += 1

cv2.imshow('sharpen', sharpen)
cv2.imshow('close', close)
cv2.imshow('thresh', thresh)
cv2.imshow('image', image)
cv2.waitKey()
Run Code Online (Sandbox Code Playgroud)

  • 谢谢你的精彩回答。我认为循环中的行“ROI = image[y:y+h, x:x+h]”应该是“ROI = image[y:y+h, x:x+w]”? (3认同)
  • 哇,,这太令人惊讶了 (3认同)