Tesseract OCR 加载语言 - 日语

Question

Tesseract OCR 加载语言 - 日语

我刚刚安装了 Tesseract OCR，在运行命令后$ tesseract --list-langs，输出仅显示 2 种语言，eng而osd. 我的问题是，如何加载另一种语言，特别是在我的情况下，日语？

Answer 1

我了解到，通过从https://github.com/tesseract-ocr/tessdata获取训练数据并将其放置在与其他训练数据相同的目录中，即eng.traineddata通过传递语言标志-l LANGtesseract 应该能够读取您指定的语言，在以下示例中为日语：tesseract -l jpn sample-jpn.png output-jpn。

归档时间：	8 年，10 月前
查看次数：	10067 次
最近记录：	6 年，11 月前