我正在使用OCRFeeder的 OCR 实用程序。OCRFeeder 正在使用tesseract引擎。我已经安装了 tesseract 所需的几个语言包。如何设置语言,以便 tesseract 使用正确的语言文件将扫描的文档转换为文本?
您需要在 OCR Feeder 设置上设置引擎命令行。它应该看起来像:
-l lang_id $IMAGE $FILE; cat $FILE.txt
Run Code Online (Sandbox Code Playgroud)
其中 lang_id 是对应语言包名称上显示的 id。