是否可以限制tesseract正在寻找的字符集(例如,仅搜索字母az)?这将极大地改善我的结果.
有没有人有OCR不同字体的经验?我正在生成一个ID,然后尝试用tesseract扫描它.目前我只是T&E'n不同的字体,但这似乎效率很低.我尝试过OCR*系列字体,以及Arial和Georgia等其他各种字体.tesseract往往与OCR*字体混淆.
是否有专门为tesseract设计的字体,或任何适合它的系统字体?
OpenCv 不读取图像的元数据。这样,我们就无法获取图像的 dpi。当有人在stackoverflow中询问dpi相关的ocr问题时,
\n大多数答案都说我们不需要 DPI。我们只需要像素大小。
\n\n\n在某些地方,没有人询问 dpi 并且需要提高 OCR 准确性,有人会想出将 DPI 设置为 300 会提高准确性的想法。
\n\n\n还有一件事是,Tesseract 在他们的官方页面上说
\n\n\nTesseract 在 DPI 至少为 300 dpi 的图像上效果最佳,因此调整图像大小可能会有好处。
\n
经过一番谷歌搜索后,我发现了以下内容。
\n