R.E*_*.E. 6 opencv tesseract machine-learning opencv3.0 keras
我试图使用Opencv,Tesseract和Keras的组合从一系列不同的收据中提取信息.该项目的最终结果是我应该能够使用电话拍摄收据,并从该图片中获取商店名称,支付类型(卡或现金),支付金额和更改投标.
到目前为止,我已经使用Opencv对一系列不同的样本收据进行了一些不同的预处理步骤,例如删除背景,去噪和转换为二进制图像,并留下如下图像:
然后我使用Tesseract在收据上执行ocr并将结果写入文本文件.我已经设法让ocr在可接受的水平上执行,所以我现在可以拍一张收据并在其上运行我的程序,我将得到一个包含收据上所有文本的文本文件.
我的问题是我不想要收据上的所有文字,我只想要一些信息,比如我上面列出的参数.我不确定如何去训练一个可以提取我需要的数据的模型.
我是否认为我应该使用Keras对图像的不同部分进行分段和分类,然后在我的模型分类为包含相关数据的部分中将文本写入文件?或者,对于我需要做的事情,是否有更好的解决方案?
对不起,如果这是一个愚蠢的问题,这是我的第一个Opencv /机器学习项目,我的相当远远不够.任何建设性的批评都会受到高度赞赏.
使用图像是个好主意,因为如果您只是使用普通 OCR,您将失去文档的结构。我认为你走在正确的道路上。我会将账单分为标题、总额、行项目,并对其进行图像分类器的训练。然后您可以使用它从文本中清理/提取您需要的相关信息
| 归档时间: |
|
| 查看次数: |
1814 次 |
| 最近记录: |