从图像中删除网格

Xai*_*ano 3 python opencv image-processing scikit-image

我正在开发一个项目,该项目允许用户拍摄手写公式的照片并将其发送到我的服务器。我只想留下与数学相关的符号,而不是表格网格。

样本照片:

(1) 原始RGB照片 原始照片(RGB

(2) 灰度模糊 模糊的灰度照片

(3) 应用自适应阈值后 应用自适应阈值后

注意: 我希望我的算法能够处理任何颜色的工作表网格。

一些代码片段可能是什么?

sco*_*ttt 5

结果

如果不确切知道需要什么样的纸张/线条和墨水组合,以及输出的确切用途,这是一个具有挑战性的问题。我想我应该尝试一下,也许能学到一些东西。

我看到有两种方法可以解决这个问题:

  1. 聪明的方法:识别网格,它的颜色,方向,大小,找到它占据的图像区域,以便忽略它。这里有一些重要的警告需要解决。例如,页面可能不会被拍摄为平坦和方形(必须考虑到扭曲、扭曲、旋转)。还会有一些我们不想删除的行。

  2. 简单的方法:应用一般的图像处理,除了假设笔总是比网格更暗之外,对问题知之甚少,并且输出是二进制的(黑笔/白页)。

我更喜欢第二个,因为它更容易实现并且概括性更好。

我们首先注意到页面的“白色”实际上是不均匀的灰色阴影(如果我们转换为灰度)。CV 自适应阈值很好地解决了这个问题。它几乎让我们到达那里。

下面的代码以 50x50 像素块处理图像,以解决光照不均匀的问题。在每个块中,我们在应用阈值之前减去中值。一个简单的解决方案,但也许正是您所需要的。我还没有在很多图像上测试过它,阈值以及预处理和后处理可能需要调整。如果输入图像变化很大,或者网格相对于墨水太暗,它将不起作用。

import cv2
import numpy
import sys

BLOCK_SIZE = 50
THRESHOLD = 25


def preprocess(image):
    image = cv2.medianBlur(image, 3)
    image = cv2.GaussianBlur(image, (3, 3), 0)
    return 255 - image


def postprocess(image):
    image = cv2.medianBlur(image, 5)
    # image = cv2.medianBlur(image, 5)
    # kernel = numpy.ones((3,3), numpy.uint8)
    # image = cv2.morphologyEx(image, cv2.MORPH_OPEN, kernel)
    return image


def get_block_index(image_shape, yx, block_size): 
    y = numpy.arange(max(0, yx[0]-block_size), min(image_shape[0], yx[0]+block_size))
    x = numpy.arange(max(0, yx[1]-block_size), min(image_shape[1], yx[1]+block_size))
    return tuple(numpy.meshgrid(y, x))


def adaptive_median_threshold(img_in):
    med = numpy.median(img_in)
    img_out = numpy.zeros_like(img_in)
    img_out[img_in - med < THRESHOLD] = 255
    return img_out


def block_image_process(image, block_size):
    out_image = numpy.zeros_like(image)
    for row in range(0, image.shape[0], block_size):
        for col in range(0, image.shape[1], block_size):
            idx = (row, col)
            block_idx = get_block_index(image.shape, idx, block_size)
            out_image[block_idx] = adaptive_median_threshold(image[block_idx])

    return out_image


def process_image_file(filename):
    image_in = cv2.cvtColor(cv2.imread(filename), cv2.COLOR_BGR2GRAY)

    image_in = preprocess(image_in)
    image_out = block_image_process(image_in, BLOCK_SIZE)
    image_out = postprocess(image_out)

    cv2.imwrite('bin_' + filename, image_out)


if __name__ == "__main__":
    process_image_file(sys.argv[1])
Run Code Online (Sandbox Code Playgroud)