如何使用Opencv进行文件识别与OCR?

Ric*_*rdo 23 opencv image-processing

我是计算机视觉的初学者,但我知道如何在opencv上使用某些功能.我尝试使用Opencv进行文档识别,我想帮助找到它的步骤.

我想使用opencv示例find_obj.cpp,但文件,例如护照,有一些变量,名称,生日,图片.所以,我需要一个帮助来定义它的步骤,如果可能的话,我必须在步骤中使用函数.

我不是要问整个代码,但如果有人有任何示例链接,或者你只需​​输入一个演练,那就非常有帮助.

Kyl*_*ald 33

这里涉及两个非常不同的步骤.一个是检测你的对象,另一个是分析它.

对于物体检测,您只是想弄清楚物体是否在框架中,以及它所在的位置.OpenCv功能框架非常适合这一点.有关一些教程和全面的示例代码,请参阅OpenCv features2d教程,尤其是功能匹配教程.

对于分析,您需要深入研究光学字符识别(OCR).OpenCv不包括OCR库,但我建议检查tesseract-ocr,这是一个很棒的OCR库.如果您的文档具有固定的结构化(文本字段的一致布局),那么tesseract-ocr就是您所需要的.有关检查ocropus的更高级分析,它使用tesseract-ocr但添加了布局分析.

  • 如果您在实际示例中遇到问题,您可能需要针对您正在使用的特定字体训练 tesseract-ocr。否则它将使用它的默认数据库,这可能与您正在使用的文本不匹配。在将文本输入到 tesseract-ocr 之前,您可以尝试缩放文本,我发现 20 px 左右的高度效果很好。 (2认同)