我正在尝试训练tesseract来识别燃气表真实图像中的数字.
我用于训练的图像是用相机拍摄的,因此存在许多问题:图像分辨率差,图像模糊,光线不足或由于曝光过度,反射,阴影等导致的低对比度......
为了训练,我创建了一个大图像,其中包含由燃气表图像捕获的一系列数字,我手动编辑文件框以创建.tr文件.结果是,只有更清晰和更清晰的图像的数字被识别,而模糊图像的数字不被tesseract捕获.
ocr opencv tesseract
ocr ×1
opencv ×1
tesseract ×1