opencv中的二值化和背景过滤

R4j*_*R4j 7 ocr opencv tesseract image-processing

不久,我想在OCR之前制定预处理程序,建议来自ABBYY的技术.文章分为两部分:

  • 背景过滤:从背景中分离文本字符串. 在此输入图像描述
  • 自适应二值化:可以正确检测线条和单词,并达到更高的识别准确度.他们试图影响角色. 在此输入图像描述 在此输入图像描述

我想知道有没有办法通过使用来实现它们opencv?任何建议或示例代码将不胜感激.

pag*_*hdv 3

我鼓励您使用此代码:http://liris.cnrs.fr/christian.wolf/software/binarize/ 特别是 Wolf 的二值化,它在实践中效果非常好,如果您愿意,它只需对 C++ 代码进行很少的更改与 opencv 一起使用。基本上,您必须将指向图像数据的指针传递给此函数。