OpenCV:OCR 之前阴影图像的轮廓检测

TFC*_*TFC 3 python ocr opencv image

我正在尝试对文档图片进行 OCR,我目前的方法是

  1. 将图像读取为灰度
  2. 二值化阈值
  3. 沿着从以下获得的轮廓包裹透视cv2.findContours()

如果图像没有阴影,上述方法效果很好。现在我想获得阴影图片的轮廓。我的第一次尝试是用于cv2.adaptiveThreshold步骤 2。自适应阈值成功地削弱了阴影,但生成的图像失去了纸张和背景之间的对比度。这使得 cv2 无法找到纸张的轮廓。所以我需要使用其他方法来去除阴影。

有什么办法可以去除阴影并保持背景颜色吗?

作为参考,这里是我正在使用各种方法处理的示例图片。从左开始,我做了

  1. 灰度
  2. 阈值化
  3. 自适应阈值
  4. 正常化

我的目标是获得第二张没有阴影的图片。

在此输入图像描述

请注意,我其实有一个专门针对图片的临时解决方案,就是将图片有阴影的部分单独处理。然而,它不是阴影图片的通用解决方案,因为它的性能取决于阴影的大小、形状和位置,所以请使用其他方法。

这是原图。

在此输入图像描述

fmw*_*w42 5

这是 Python/OpenCV 中使用除法归一化的一种方法,可以选择随后进行锐化和/或阈值化。

输入:

在此输入图像描述

import cv2
import numpy as np
import skimage.filters as filters

# read the image
img = cv2.imread('receipt.jpg')

# convert to gray
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# blur
smooth = cv2.GaussianBlur(gray, (95,95), 0)

# divide gray by morphology image
division = cv2.divide(gray, smooth, scale=255)


# sharpen using unsharp masking
sharp = filters.unsharp_mask(division, radius=1.5, amount=1.5, multichannel=False, preserve_range=False)
sharp = (255*sharp).clip(0,255).astype(np.uint8)

# threshold
thresh = cv2.threshold(sharp, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

# save results
cv2.imwrite('receipt_division.png',division)
cv2.imwrite('receipt_division_sharp.png',sharp)
cv2.imwrite('receipt_division_thresh.png',thresh)


# show results
cv2.imshow('smooth', smooth)  
cv2.imshow('division', division)  
cv2.imshow('sharp', sharp)  
cv2.imshow('thresh', thresh)  
cv2.waitKey(0)
cv2.destroyAllWindows()
Run Code Online (Sandbox Code Playgroud)

分配:

在此输入图像描述

锐化:

在此输入图像描述

阈值:

在此输入图像描述