如何从图像生成tiff/box文件以在Windows中训练Tesseract

gre*_*gna 7 windows ocr tesseract machine-learning training-data

我正在尝试在Windows中训练Tesseract,为此我需要一对tiff/box文件,我正在尝试使用jTessBoxEditor创建它,但它不接受图像作为输入.我也尝试过boxFactory,但它运行不正常.有谁知道从图像创建配对的最佳工具是什么?

谢谢

dar*_*pot 9

如果你有jTessBoxEditor,那么你有Tesseract bin文件.转到jTessBoxEditor 的tesseract-ocr子文件夹并运行以下命令:

tesseract.exe D:\ testocr\TestImage.tif D:\ testocr\TestImage batch.nochop makebox

它应该生成文件D:\ testocr\TestImage.box.然后在jTessBoxEditor中,转到Box Editor选项卡并打开图像.盒子文件会自动加载,您可以检查一切是否正常并纠正可能的错误.