如何以编程方式读取扫描的文档或图像

Question

我在网上搜索过,因为在OCR方面我有点像n00b,而我实际上并不确定一个好的起点在哪里.

我想构建一个能够识别和计算的应用程序,例如说明在任何给定的文档/图像行中填写了多少个复选框(如果有人知道更好的套件,它甚至可能是另一种格式这种类型的应用).最终目标是消除手动数据捕获并加快将整体统计数据提供给应用程序最终用户的过程

我主要以c#编码,所以.net解决方案会更好,但如果不是,我会采取我能得到的.

我的想法是重新设计用户填写的表格,使其与此类似.(请原谅粗略的ASCII艺术:P)所以填写表格的人只需检查纸上的值.

                |  1  |  2  |  3  |  4  |  5  |  
Product A       | [ ]   [ ]   [ ]   [ ]   [x] |    
Product B       | [ ]   [ ]   [x]   [ ]   [ ] |

任何想法将不胜感激

谢谢!

Answer 1

1)您还可以检查免费但功能强大的Tesseract OCR引擎.它是用C++编写的,但您可以使用C#轻松地与它进行交互.

2)如果您想使用图像处理自己动手,可以使用EmguCV库,它是OpenCV的.NET包装器.

最近有一篇关于opencv-tag的帖子,它试图解决一个非常类似的问题,涉及检测乐透卡上的标记.