小编Shi*_*kar的帖子

Tesseract 4 与 OCR 引擎模式一起使用时无法加载任何语言 - “Legacy + LSTM 引擎”(--oem 2)

我认为这个问题只与支持 LSTM 的 Tesseract 4 有关。由于我使用的是 64 位 Windows 系统,因此我从这里下载了64 位 Windows 可执行文件- https://github.com/UB-Mannheim/tesseract/wiki

它具有以下 OCR 引擎模式:

  • 0 仅限旧版引擎。
  • 1 仅限神经网络 LSTM 引擎。
  • 2 传统 + LSTM 引擎。
  • 3 默认值,基于可用内容。

它适用于除2之外的所有模式。


使用 --oem 1 运行时

tesseract --oem 1 1.jpg 1
Run Code Online (Sandbox Code Playgroud)

结果:

Tesseract Open Source OCR Engine v4.0.0.20190314 with Leptonica
Warning: Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 561
Detected 5 diacritics
Run Code Online (Sandbox Code Playgroud)

并创建一个文件1.txt与相应的 OCR 结果。


使用 --oem 2 运行时

tesseract --oem 2 …
Run Code Online (Sandbox Code Playgroud)

ocr tesseract lstm

4
推荐指数
1
解决办法
6695
查看次数

标签 统计

lstm ×1

ocr ×1

tesseract ×1