你能用图像而不是文字和字体训练tesseract吗？

Question

你能用图像而不是文字和字体训练tesseract吗？

在tesseract 文档中,解释了使用示例文本和字体进行训练的方法.
我使用了jTessBoxEditor,但其工作方式与tesseract培训工具非常相似.
我得到了一些可接受的结果,但我认为最佳解决方案是训练tesseract,无论如何都必须识别实际类型的图像.
由于我只需要识别数字,我可以手工切割每个数字,也许每个数字的许多版本,并用这些图像训练tesseract,甚至手动设置框.
有没有办法做到这一点？

Answer 1

小智 0

如果您正在尝试训练 tesseract4，您可以使用ocrd-train 您基本上准备了与每行文本相对应的图像及其基本事实，它将为您完成所有剩余的工作。

归档时间：	7 年，11 月前
查看次数：	329 次
最近记录：	7 年，2 月前