我目前正在从事一个涉及使用 Tess4j Tesseract OCR 引擎的项目。在从事这个项目时,我遇到了很多网站,这些网站声称 Tesseract 在至少 300 DPI(每英寸点数)的图像上效果最好。
我的问题是为什么在图像中多次提到 DPI。我知道当您扫描一个对象时,您希望以至少 300 DPI 对其进行扫描。我只是不明白为什么这与用相机拍摄的照片有关。据我所知,DPI 是打印机的一个属性。基于此属性,它越高,图像越小,但质量越高。
现在,如果 DPI 与这些图像无关,那么我想知道为什么当我在 72 和 300 之间更改图像的 DPI 属性时,程序的结果会有所不同。是否有我不知道的 Tesseract 预处理?