我想用它tesseract来识别数字.问题是我有数字和字母的混合,当我SetVariable("tessedit_char_whitelist", "0123456789")
用于每个符号时,tesseract返回错误的数字.
我可以设置一个阈值,以便tesseract省略低相似性的符号吗?
注意:我设置tesseract只识别数字,因此O和0之间没有混淆.
我使用tesseract 3.0.0,我遇到了以下问题:
当有一些东西太小而tesseract无法识别它似乎与其他碎片合并.结果没有返回任何相关内容.
下图显示了3个案例.只有带虚线的矩形传递给tesseract.在矩形上是结果(V over T表示新行).
最后一个案例是问题一个.在这种情况下,有什么方法可以改善tesseract吗?
