有没有人有OCR不同字体的经验?我正在生成一个ID,然后尝试用tesseract扫描它.目前我只是T&E'n不同的字体,但这似乎效率很低.我尝试过OCR*系列字体,以及Arial和Georgia等其他各种字体.tesseract往往与OCR*字体混淆.
是否有专门为tesseract设计的字体,或任何适合它的系统字体?
我正在将 tesseract 与 python 一起使用。它几乎可以识别我所有带有 2 个或更多数字或字符的图像。但是 tesseract 不能识别只有一个数字的图像。我尝试使用命令行,它给了我“空页”作为响应。
我不想用“只有数字”来训练 tesseract,因为我也在识别字符。
问题是什么?
在 tesseract 无法识别的图像下方。
代码:
#getPng(pathImg, '3') -> creates the path to the figure.
pytesseract.image_to_string( Image.open(getPng(pathImg, '3'))
Run Code Online (Sandbox Code Playgroud)