小编Rae*_*rji的帖子

如何用不同颜色和字体的文本改善图像的OCR?

我正在使用Google Vision API从某些图片中提取文本,但是,我一直在努力提高结果的准确性(可信度),但并不算幸运。

每次我从原始图像更改图像时,都会丢失检测某些字符的准确性。

我已经隔离了一个问题,使不同的单词具有多种颜色,例如,红色的单词比其他单词的错误结果更多。

例:

灰度或黑白图像上的某些变化

原始图片

在此处输入图片说明

在此处输入图片说明

在此处输入图片说明

在此处输入图片说明

我有什么想法可以使它更好地工作,特别是将文本的颜色更改为统一的颜色,或者将白色背景上的颜色更改为黑色,因为大多数算法都希望这样做?

我已经尝试过的一些想法,也有一些门槛。

dimg = ImageOps.grayscale(im)
cimg = ImageOps.invert(dimg)

contrast = ImageEnhance.Contrast(dimg)
eimg = contrast.enhance(1)

sharp = ImageEnhance.Sharpness(dimg)
eimg = sharp.enhance(1)
Run Code Online (Sandbox Code Playgroud)

python ocr python-imaging-library google-vision

6
推荐指数
1
解决办法
3504
查看次数