小编Dua*_*ade的帖子

Tesseract / PYOCR 检测“Z”为“2”

我在我的应用程序中使用 pyocr ( https://github.com/openpaperwork/pyocr ),除了以下情况外,它一切正常:

从这张图片来看:

在此输入图像描述

Tesseract 将提取:

42Z8

它检测到其中一个 Z,但检测不到另一个“Z”,这一点很重要,因为该数字通过了验证,如果发生此问题,验证就会失败。

我尝试过的事情:

  1. 将字体(flama).traineddata 文件与 tesseract 一起使用,没有修复。
  2. 像图像一样隔离块可以看到检测效果更好。
  3. 进行一些图像处理,例如:

thresh = cv.threshold(块文本, 127, 255, cv.THRESH_BINARY)

我怎样才能解决这个问题 ?也许解决方案是一些更复杂的图像处理,但我现在有点迷失。

谢谢。

更新图片:

在此输入图像描述

python ocr opencv tesseract

6
推荐指数
1
解决办法
1331
查看次数

标签 统计

ocr ×1

opencv ×1

python ×1

tesseract ×1