提高图像的 DPI

Ran*_*dom 1 tesseract imagemagick image-processing computer-vision

跟进这个帖子

你好社区。我正在尝试解决与上面帖子中提到的相同的问题。我想在将图像发送到 OCR 之前对其进行预处理,以便获得不错的输出。出于这个原因,我想增加图像的 DPI,建议的解决方案是使用 Imagemagik。有人可以帮助我如何使用 Imagemagick 重新采样图像吗?它有很多重采样过滤器,我不确定如何进一步进行。这是 ImageMagick 重采样页面Resampling的链接。

我是信号处理和计算机视觉的新手。我希望一些大师可以建议我做什么以及如何做。

xen*_*oid 5

DPI 是一个非常任意的衡量标准,它只是一个可以随意更改的元数据。您想要做的是真正升级图像(相同物理尺寸的更多像素:更高的 DPI)。

但恕我直言,以这种方式添加像素是行不通的。OCR 软件需要更高的 DPI,因为这通常意味着需要处理更多信息。在 300DPI 下,10 点小写字符约为 20x20px(400 像素),在 100DPI 下,它仅为 7x7。

当您放大图片时,您不会在图像中添加信息。新像素只是根据现有像素计算出来的。最终效果是,放大后的图像要么像素化,要么模糊,具体取决于所使用的算法,并且 OCR 并不能真正获得更多数据来处理。

TL;DR:您可以尝试重新采样,但不太可能起作用。

在水獭手上,DPI 在这里毫无意义。它仅在扫描通常大小(大约 10 点)的打印文本时用作指示,真正重要的是字符的大小(以像素为单位)。如果它们已经是 20x20 左右(高 DPI 时小字体,或低 DPI 时大字体),那么应该没问题。