我认为这个问题只与支持 LSTM 的 Tesseract 4 有关。由于我使用的是 64 位 Windows 系统,因此我从这里下载了64 位 Windows 可执行文件- https://github.com/UB-Mannheim/tesseract/wiki
它具有以下 OCR 引擎模式:
它适用于除2之外的所有模式。
tesseract --oem 1 1.jpg 1
Run Code Online (Sandbox Code Playgroud)
结果:
Tesseract Open Source OCR Engine v4.0.0.20190314 with Leptonica
Warning: Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 561
Detected 5 diacritics
Run Code Online (Sandbox Code Playgroud)
并创建一个文件1.txt与相应的 OCR 结果。
tesseract --oem 2 …Run Code Online (Sandbox Code Playgroud)