我正在使用Google Vision API从某些图片中提取文本,但是,我一直在努力提高结果的准确性(可信度),但并不算幸运。
每次我从原始图像更改图像时,都会丢失检测某些字符的准确性。
我已经隔离了一个问题,使不同的单词具有多种颜色,例如,红色的单词比其他单词的错误结果更多。
例:
灰度或黑白图像上的某些变化
我有什么想法可以使它更好地工作,特别是将文本的颜色更改为统一的颜色,或者将白色背景上的颜色更改为黑色,因为大多数算法都希望这样做?
我已经尝试过的一些想法,也有一些门槛。
dimg = ImageOps.grayscale(im)
cimg = ImageOps.invert(dimg)
contrast = ImageEnhance.Contrast(dimg)
eimg = contrast.enhance(1)
sharp = ImageEnhance.Sharpness(dimg)
eimg = sharp.enhance(1)
Run Code Online (Sandbox Code Playgroud)