我正在尝试训练tesseract来识别燃气表真实图像中的数字.
我用于训练的图像是用相机拍摄的,因此存在许多问题:图像分辨率差,图像模糊,光线不足或由于曝光过度,反射,阴影等导致的低对比度......
为了训练,我创建了一个大图像,其中包含由燃气表图像捕获的一系列数字,我手动编辑文件框以创建.tr文件.结果是,只有更清晰和更清晰的图像的数字被识别,而模糊图像的数字不被tesseract捕获.
我正在尝试开发一个使用OCR的Android应用程序.应用程序应该能够扫描名片和其他文档来提取内容.
是否可以使用Google Docs Api实现此功能?我该怎么做?