小编Rae*_*rji的帖子

如何用不同颜色和字体的文本改善图像的OCR？

我正在使用Google Vision API从某些图片中提取文本，但是，我一直在努力提高结果的准确性（可信度），但并不算幸运。

每次我从原始图像更改图像时，都会丢失检测某些字符的准确性。

我已经隔离了一个问题，使不同的单词具有多种颜色，例如，红色的单词比其他单词的错误结果更多。

例：

灰度或黑白图像上的某些变化

我有什么想法可以使它更好地工作，特别是将文本的颜色更改为统一的颜色，或者将白色背景上的颜色更改为黑色，因为大多数算法都希望这样做？

我已经尝试过的一些想法，也有一些门槛。

dimg = ImageOps.grayscale(im)
cimg = ImageOps.invert(dimg)

contrast = ImageEnhance.Contrast(dimg)
eimg = contrast.enhance(1)

sharp = ImageEnhance.Sharpness(dimg)
eimg = sharp.enhance(1)

Run Code Online (Sandbox Code Playgroud)

python ocr python-imaging-library google-vision

Rae*_*rji

lucky-day

6
推荐指数

1
解决办法

3504
查看次数

标签统计

google-vision ×1

ocr ×1

python ×1

python-imaging-library ×1

如何用不同颜色和字体的文本改善图像的OCR？

标签 统计

小编Rae_rji的帖子

标签统计