Tesseract OCR上的数字号码

adr*_*992 5 android opencv tesseract

解:

我必须训练自己的数据才能使用OCR进行尝试。看来效果很好,但我不知道为什么arturaugusto训练后的数据对我不起作用=(

https://github.com/adri1992/Tesseract_sevenSegmentsLetsGoDigital.git

使用我训练有素的数据,为了获得OCR的良好效果,我完成了以下阶段(我已经使用OpenCV完成了此阶段):

  • 首先,将图像转换为黑白
  • 其次,将高斯模糊应用于图像
  • 第三,对图像应用阈值过滤器

这样,可以识别七个分段数字。

题:

我正在尝试通过Android上的Tesseract获得OCR,并且正在使用此图像测试应用(通过Tesseract OCR在“七段显示器”上进行文本检测):

OCR测试图

我正在使用arturaugusto(https://github.com/arturaugusto/display_ocr)训练的数据,但是OCR的错误结果是:

884288

零被认为是八,我不知道为什么。

我通过OpenCV将高斯模糊和阈值滤镜应用于图像,经过处理的图像是这样的:

OCR图像已处理

是否还有其他训练有素的数据,或者您知道解决问题的任何方法吗?

art*_*art 0

尝试使用 erode 来填充段之间的间隙。我认为问题在于 tesseract 无法处理良好的分段字体。

我用OpenCV-python来cv2.erode(display,kernel, iterations = erosion_iters)解决这个问题。