Tesseract Ocr Engine立方体模式 - 训练Tesseract

Geo*_*dis 5 ocr tesseract cube

你能解释一下在Tesseract ocr引擎上有什么立方体模式和立方体数据文件吗?使用它们有什么好处?

我如何训练希腊的tesseract获得更好的结果?

Sia*_*ich 5

对于那些可能仍然感兴趣的人.在Tesseract的网站上,有针对不同文件的标准训练数据集.

https://code.google.com/p/tesseract-ocr/downloads/list?num=100&start=100

此处描述了培训程序(3.01版)

https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

在Cube的情况下,与Tesseract相比,还有另一个引擎.它消耗更多资源,速度更慢,但效果更好.

数据文件 - 文件集,最终应该引导(合并到)训练的数据文件.