如何在OpenCV中定义Watershed的标记？

Question

如何在OpenCV中定义Watershed的标记？

Tru*_*Tru 67 opencv image-processing computer-vision image-segmentation watershed

我正在用OpenCV为Android写作.我正在使用标记控制的分水岭分割类似于下面的图像,而无需用户手动标记图像.我打算使用区域最大值作为标记.

minMaxLoc()会给我价值,但我怎么能把它限制在我感兴趣的blob？我可以利用findContours()cvBlob blob 的结果来限制ROI并对每个blob应用最大值吗？

输入图像

Answer 1

首先:该函数minMaxLoc仅查找给定输入的全局最小值和全局最大值,因此它对于确定区域最小值和/或区域最大值几乎没用.但是你的想法是正确的,基于区域最小/最大值提取标记以执行基于标记的分水岭变换是完全没问题的.让我试着澄清什么是Watershed Transform以及如何正确使用OpenCV中的实现.

处理分水岭的一些相当数量的论文与后面的内容相似(我可能会错过一些细节,如果你不确定的话:问).考虑一下您知道的某个区域的表面,它包含山谷和山峰(以及其他与我们无关的细节).假设在这个表面下方,你只有水,有色水.现在,在你的表面的每个山谷中打洞,然后水开始填满所有区域.在某些时候,不同颜色的水域会相遇,当发生这种情况时,你会建造一个大坝,使它们不会相互接触.最后,您将拥有一系列水坝,这是将所有不同颜色的水分开的分水岭.

现在,如果你在那个表面上制作太多的洞,你最终会得到太多的区域:过分割.如果你做得太少,你会得到一个不足的细分.因此,几乎任何建议使用分水岭的纸张实际上都提供了避免这些问题的技术,以应对纸张正在处理的应用.

我写了所有这些(对于知道Watershed Transform是什么的人来说,这可能太天真了),因为它直接反映了你应该如何使用分水岭实现(当前接受的答案以完全错误的方式进行).现在让我们使用Python绑定开始OpenCV示例.

问题中呈现的图像由许多对象组成,这些对象过于接近并且在某些情况下重叠.此处分水岭的用处是正确分离这些对象,而不是将它们分组为单个组件.因此,每个对象至少需要一个标记,背景需要很好的标记.作为示例,首先通过Otsu对输入图像进行二值化并执行用于移除小对象的形态开口.该步骤的结果如左图所示.现在用二进制图像考虑对它应用距离变换,得到右边的结果.

在此输入图像描述

利用距离变换结果,我们可以考虑一些阈值,使得我们仅考虑距离背景最远的区域(左下图).这样做,我们可以通过在较早的阈值之后标记不同的区域来获得每个对象的标记.现在,我们还可以考虑上面左图的扩张版本的边界来构成我们的标记.完整标记显示在右下方(某些标记太暗而无法看到,但左图中的每个白色区域都显示在右图中).

在此输入图像描述

我们这里的标记很有意义.每个都colored water == one marker将开始填充该区域,并且分水岭变换将构建水坝以阻止不同的"颜色"合并.如果我们进行变换,我们会得到左边的图像.通过将它们与原始图像组合来仅考虑水坝,我们得到了正确的结果.

在此输入图像描述

import sys
import cv2
import numpy
from scipy.ndimage import label

def segment_on_dt(a, img):
    border = cv2.dilate(img, None, iterations=5)
    border = border - cv2.erode(border, None)

    dt = cv2.distanceTransform(img, 2, 3)
    dt = ((dt - dt.min()) / (dt.max() - dt.min()) * 255).astype(numpy.uint8)
    _, dt = cv2.threshold(dt, 180, 255, cv2.THRESH_BINARY)
    lbl, ncc = label(dt)
    lbl = lbl * (255 / (ncc + 1))
    # Completing the markers now. 
    lbl[border == 255] = 255

    lbl = lbl.astype(numpy.int32)
    cv2.watershed(a, lbl)

    lbl[lbl == -1] = 0
    lbl = lbl.astype(numpy.uint8)
    return 255 - lbl


img = cv2.imread(sys.argv[1])

# Pre-processing.
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)    
_, img_bin = cv2.threshold(img_gray, 0, 255,
        cv2.THRESH_OTSU)
img_bin = cv2.morphologyEx(img_bin, cv2.MORPH_OPEN,
        numpy.ones((3, 3), dtype=int))

result = segment_on_dt(img, img_bin)
cv2.imwrite(sys.argv[2], result)

result[result != 255] = 0
result = cv2.dilate(result, None)
img[result == 255] = (0, 0, 255)
cv2.imwrite(sys.argv[3], img)

归档时间：	13 年，4 月前
查看次数：	59167 次
最近记录：	7 年，5 月前