你能用图像而不是文字和字体训练tesseract吗?

Pet*_*uza 5 ocr tesseract training-data

在tesseract 文档中,解释了使用示例文本和字体进行训练的方法.
我使用了jTessBoxEditor,但其工作方式与tesseract培训工具非常相似.
我得到了一些可接受的结果,但我认为最佳解决方案是训练tesseract,无论如何都必须识别实际类型的图像.
由于我只需要识别数字,我可以手工切割每个数字,也许每个数字的许多版本,并用这些图像训练tesseract,甚至手动设置框.
有没有办法做到这一点?

小智 0

如果您正在尝试训练 tesseract4,您可以使用ocrd-train 您基本上准备了与每行文本相对应的图像及其基本事实,它将为您完成所有剩余的工作。