使用 opencv 在图像中查找形状

mpe*_*kov 5 python opencv

我正在尝试使用 OpenCV 在图像中查找形状。我知道我想要匹配的形状(有些形状我不知道,但我不需要找到它们)和它们的方向。我不知道它们的大小(比例)和位置。

我目前的做法:

  1. 检测轮廓
  2. 对于每个轮廓,计算最大边界框
  3. 将每个边界框分别与已知形状之一匹配。在我的实际项目中,我将区域缩放到模板大小并计算 Sobel 梯度的差异,但对于此演示,我仅使用纵横比。

这种方法失败的地方是形状接触的地方。轮廓检测将两个相邻的形状拾取为单个轮廓(单个边界框)。匹配步骤显然会失败。

有没有办法修改我分别处理相邻形状的方法?另外,有没有更好的方法来执行第 3 步?

例如:(Es 为绿色,Ys 为蓝色)

在此处输入图片说明

失败案例:(红色未知形状)

在此处输入图片说明

源代码:

import cv
import sys
E = cv.LoadImage('e.png')
E_ratio = float(E.width)/E.height
Y = cv.LoadImage('y.png')
Y_ratio = float(Y.width)/Y.height
EPSILON = 0.1

im = cv.LoadImage(sys.argv[1], cv.CV_LOAD_IMAGE_GRAYSCALE)
storage = cv.CreateMemStorage(0)
seq = cv.FindContours(im, storage, cv.CV_RETR_EXTERNAL, 
        cv.CV_CHAIN_APPROX_SIMPLE)
regions = []
while seq:
    pts = [ pt for pt in seq ]
    x, y = zip(*pts)    
    min_x, min_y = min(x), min(y)
    width, height = max(x) - min_x + 1, max(y) - min_y + 1
    regions.append((min_x, min_y, width, height))
    seq = seq.h_next()

rgb = cv.LoadImage(sys.argv[1], cv.CV_LOAD_IMAGE_COLOR)
for x,y,width,height in regions:
    pt1 = x,y
    pt2 = x+width,y+height
    if abs(float(width)/height - E_ratio) < EPSILON:
        color = (0,255,0,0)
    elif abs(float(width)/height - Y_ratio) < EPSILON:
        color = (255,0,0,0)
    else:
        color = (0,0,255,0)
    cv.Rectangle(rgb, pt1, pt2, color, 2)

cv.ShowImage('rgb', rgb)
cv.WaitKey(0)
Run Code Online (Sandbox Code Playgroud)

.png:

在此处输入图片说明

y.png:

在此处输入图片说明

好的:

在此处输入图片说明

坏的:

在此处输入图片说明

在有人问之前,不,我不是要破解验证码 :) OCR 本身在这里并不真正相关:我真实项目中的实际形状不是字符——我只是懒惰,字符是最容易绘制的东西(仍然会被微不足道的方法检测到)。

jle*_*and 4

由于形状的大小和比例可能会有所不同,因此您应该考虑缩放不变描述符。一堆这样的描述符将非常适合您的应用程序。

在测试模板上处理这些描述符,然后使用某种简单的分类来提取它们。正如您所展示的,它应该通过简单的形状给出非常好的结果。

我过去使用过 Zernike 和 Hu 时刻,后者是最著名的。您可以在这里找到实现示例:http://www.lengrand.fr/2011/11/classification-hu-and-zernike-moments-matlab/

另一件事:鉴于您的问题,您应该考虑 OCR 技术(代表光学字符识别:http://en.wikipedia.org/wiki/Optical_character_recognition;))。

希望这个对你有帮助。

朱利安