从图像中提取线条以提供给 OCR - Tesseract

bir*_*rdy 5 opencv tesseract image-processing

我在 pycon http://youtu.be/B1d9dpqBDVA?t=15m34s附近观看了 15:33 标记的演讲,演讲者谈到从图像(收据)中提取线条,然后将其提供给 OCR 引擎,以便文本可以以更好的方式提取。

我有一个类似的需求,我将图像传递给 OCR 引擎。但是,我不太明白他从图像中提取线条的含义。我可以使用哪些开源工具从图像中提取线条?

kar*_*lip 5

看看用于检测文本倾斜角度的技术。

组是用于隔离图像上的文本的线条(这是有趣的部分)。

从这个结果中,您可以轻松检测每行文本的上限/下限。文本本身将位于其中。我以前遇到过类似的问题,代码可能对您有用:

从这里您需要做的就是裁剪每对线并将其作为图像提供给 Tesseract。


Zee*_*han 0

我可以告诉你一个简单的技术将图像输入OCR..只需执行一些操作来获取图像的ROI(感兴趣区域),并在二值化后定位图像所在的区域..然后你可能会找到轮廓,并且通过保留阈值,并设置所需的轮廓区域,您可以将生成的图像输入 OCR :) ..(抱歉,解释方式不好)