训练Tesseract 3识别燃气表真实图像中的数字

Question

我正在尝试训练tesseract来识别燃气表真实图像中的数字.

我用于训练的图像是用相机拍摄的,因此存在许多问题:图像分辨率差,图像模糊,光线不足或由于曝光过度,反射,阴影等导致的低对比度......

为了训练,我创建了一个大图像,其中包含由燃气表图像捕获的一系列数字,我手动编辑文件框以创建.tr文件.结果是,只有更清晰和更清晰的图像的数字被识别,而模糊图像的数字不被tesseract捕获.

Answer 1

我会首先尝试这个简单的 ImageMagick 命令：

 convert          \
    original.jpg  \
   -threshold 50% \
    result.jpg

（稍微调整一下50%参数——尝试使用更小和更高的值......）

阈值处理基本上只为每个颜色通道留下 2 个值，零或最大值。低于阈值的值设置为 0，高于阈值的值设置为 255（如果工作在 16 位深度，则为 65535）。

根据您的原始 .jpg，您可能会得到一个支持 OCR 的、有效的、对比度非常高的图像。