我刚刚安装了 Tesseract OCR,在运行命令后$ tesseract --list-langs,输出仅显示 2 种语言,eng而osd. 我的问题是,如何加载另一种语言,特别是在我的情况下,日语?
我了解到,通过从https://github.com/tesseract-ocr/tessdata获取训练数据并将其放置在与其他训练数据相同的目录中,即eng.traineddata通过传递语言标志-l LANGtesseract 应该能够读取您指定的语言,在以下示例中为日语:tesseract -l jpn sample-jpn.png output-jpn。
| 归档时间: |
|
| 查看次数: |
10067 次 |
| 最近记录: |