我正在尝试使用Tesseract OCR从图像中提取文本.目前,使用原始输入图像(如下所示),输出质量很差(约50%).但是当我尝试删除输入图像中的所有线条和边框(使用photoshop)时,输出提高了很多(~90%).那么有没有办法以编程方式删除图像中的所有线条和边框(保留文本)(使用OpenCV,Image magick,..)?
原始图片:
期待图片:
opencv tesseract image imagemagick image-processing
image ×1
image-processing ×1
imagemagick ×1
opencv ×1
tesseract ×1