我正在尝试获得一些自动文本识别的经验,我正在使用包tesseract在某些图像上执行ocr(即我拍摄的一些截图).
为了提高我的程序识别下图中价格的性能,我使用magick软件包对图像进行了一些预处理,方法是通过改变亮度和饱和度参数来增加图像的对比度.
但是,我认为通过转换为黑白图像可以进一步提高性能.
如何在R中有效地实现这一目标?
原始图像
经过预处理
tesseract r image-processing contrast text-recognition
contrast ×1
image-processing ×1
r ×1
tesseract ×1
text-recognition ×1