Ale*_*dro 9 ocr opencv tesseract
我正在尝试训练tesseract来识别燃气表真实图像中的数字.
我用于训练的图像是用相机拍摄的,因此存在许多问题:图像分辨率差,图像模糊,光线不足或由于曝光过度,反射,阴影等导致的低对比度......
为了训练,我创建了一个大图像,其中包含由燃气表图像捕获的一系列数字,我手动编辑文件框以创建.tr文件.结果是,只有更清晰和更清晰的图像的数字被识别,而模糊图像的数字不被tesseract捕获.
我会首先尝试这个简单的 ImageMagick 命令:
convert \
original.jpg \
-threshold 50% \
result.jpg
Run Code Online (Sandbox Code Playgroud)
(稍微调整一下50%参数——尝试使用更小和更高的值......)
阈值处理基本上只为每个颜色通道留下 2 个值,零或最大值。低于阈值的值设置为 0,高于阈值的值设置为 255(如果工作在 16 位深度,则为 65535)。
根据您的原始 .jpg,您可能会得到一个支持 OCR 的、有效的、对比度非常高的图像。