Tesseract OCR 加载语言 - 日语

Fre*_*ddy 8 tesseract

我刚刚安装了 Tesseract OCR,在运行命令后$ tesseract --list-langs,输出仅显示 2 种语言,engosd. 我的问题是,如何加载另一种语言,特别是在我的情况下,日语?

Fre*_*ddy 5

我了解到,通过从https://github.com/tesseract-ocr/tessdata获取训练数据并将其放置在与其他训练数据相同的目录中,即eng.traineddata通过传递语言标志-l LANGtesseract 应该能够读取您指定的语言,在以下示例中为日语:tesseract -l jpn sample-jpn.png output-jpn