Tesseract OCR上的数字号码

Question

解：

我必须训练自己的数据才能使用OCR进行尝试。看来效果很好，但我不知道为什么arturaugusto训练后的数据对我不起作用=（

使用我训练有素的数据，为了获得OCR的良好效果，我完成了以下阶段（我已经使用OpenCV完成了此阶段）：

这样，可以识别七个分段数字。

题：

我正在尝试通过Android上的Tesseract获得OCR，并且正在使用此图像测试应用（通过Tesseract OCR在“七段显示器”上进行文本检测）：

OCR测试图

我正在使用arturaugusto（https://github.com/arturaugusto/display_ocr）训练的数据，但是OCR的错误结果是：

884288

零被认为是八，我不知道为什么。

我通过OpenCV将高斯模糊和阈值滤镜应用于图像，经过处理的图像是这样的：

OCR图像已处理

是否还有其他训练有素的数据，或者您知道解决问题的任何方法吗？

Answer 1

尝试使用 erode 来填充段之间的间隙。我认为问题在于 tesseract 无法处理良好的分段字体。

我用OpenCV-python来cv2.erode(display,kernel, iterations = erosion_iters)解决这个问题。