小编Ant*_*iot的帖子

Tesseract 选项和图像预处理

我尝试 OCR 的图像

编辑:如所问,这是原始图像

亲爱的社区,我正在尝试做一些 ocr。
我已经对图像进行了很多预处理(去歪斜,裁剪......)
现在,我可以毫无问题地自己读取数字
但是我无法得到 tesseract 给我一个有意义的结果。

单击顶部的链接查看我正在尝试 OCR 的图像

我缺少更多的预处理吗?
或者我称 tesseract 很糟糕?

我根本没有选择,或者尝试:

config = ('--psm 13 -c tessedit_char_whitelist=0123456789')
Run Code Online (Sandbox Code Playgroud)

编辑 :

有趣的是,我尝试了多种方法:

  • Windows 上的 Tesseract 5,不提供任何“eT” (但可能配置不当)
  • Windows 上 Phyton Jupyter Notebook 的 Google API => 'UO0 1124'或类似的东西不太记得了
  • Tesseract 4 on buntu with config = ('-l eng --oem 1 --psm 13') : 'WU000 244m'
  • 来自 Ubuntu 上的 Python Jpyter Notebook 的 Google API => 'U000241\n'

所以这对我来说非常重要。我可能更喜欢使用 Tesseract,以免花大钱。当我的项目更先进时,我会知道我能做什么。

但我很想听听您对图像预处理的建议!!:-)

所以如果你有建议。

问候 !

python ocr tesseract jupyter-notebook image-preprocessing

1
推荐指数
1
解决办法
6877
查看次数