小编Ant*_*iot的帖子

亲爱的社区，我正在尝试做一些 ocr。
我已经对图像进行了很多预处理（去歪斜，裁剪......）
现在，我可以毫无问题地自己读取数字
但是我无法得到 tesseract 给我一个有意义的结果。

单击顶部的链接查看我正在尝试 OCR 的图像

我缺少更多的预处理吗？
或者我称 tesseract 很糟糕？

我根本没有选择，或者尝试：

config = ('--psm 13 -c tessedit_char_whitelist=0123456789')

编辑：

有趣的是，我尝试了多种方法：

Windows 上的 Tesseract 5，不提供任何“eT” （但可能配置不当）
Windows 上 Phyton Jupyter Notebook 的 Google API => 'UO0 1124'或类似的东西不太记得了
Tesseract 4 on buntu with config = ('-l eng --oem 1 --psm 13') : 'WU000 244m'
来自 Ubuntu 上的 Python Jpyter Notebook 的 Google API => 'U000241\n'

所以这对我来说非常重要。我可能更喜欢使用 Tesseract，以免花大钱。当我的项目更先进时，我会知道我能做什么。

但我很想听听您对图像预处理的建议！！:-)

所以如果你有建议。

问候！

1
推荐指数

1
解决办法

6877
查看次数