OpenCV高斯模糊打破了Tesseract?

Tré*_*iel 7 c++ tesseract

问题:大约一周前,为了更好地提高Tesseract的准确性,我添加了一个高斯模糊/ OTSU二值化组合,产生漂亮的二进制图像,如附加的.我在openCV中这样做,所以我传递给Tesseract的图像已经是二进制图像(如附图所示).当Tesseract对图像进行预处理时(即使是下面发布的图像),图像也会损坏,因此不会产生有意义的输出.请参阅示例输入下方的图像,了解Tesseract对图像所做的操作.

问题的根源是高斯模糊.如果我删除它,Thresholded image那个tesseract输出没有乱码,但它也不像我附加的二进制图像那样干净和可读.我可以禁用Tesseract预处理我传递的图像吗?为什么Guassian模糊完全破坏了Tesseract?我觉得输入图像就像我所附的图像一样清晰,准确性会提高.

两个图像都属于同一列.首先是输入图像,第二是Tesseract图像预处理的结果.

输入TESSERACT示例:

图片

TESSERACT CORRUPTION(获自GetThresholdedImage():

二

use*_*678 1

我建议保存来自 tesseract (tess.GetThresholdedImage()) 的图像数据,并在 tess.SetImage() 之后将其存储到磁盘,这样您就可以确保为 OCR 提供了正确的图像。