为Tesseract OCR创建训练图像

Question

我正在编写一台用于训练Tesseract OCR图像的发生器.

为Tesseract OCR生成新字体的训练图像时,有哪些最佳值:

Answer 1

我找到了第四个问题的答案 - “边界框是否应该紧密贴合”。

看来尽可能地拟合矩形会产生更好的结果。

对于其他 12 点和 300 dpi 就足够了，正如 @Yaroslav 所建议的。我认为最好关闭抗锯齿功能。