使用勾选框扫描并阅读文档

Tom*_*ald 5 ocr

我有一个客户的要求,他们希望为不同地区的老人提供膳食.为此,人们根据每天的选择填写一周的表格并勾选方框(它还考虑了具体要求).

例如 :

 Name
 Commune

                  With salt ( )      Without salt []

Mon :       Meal 1 ( )                   Meal 2 ( )
           Dessert 1 ( )                 Dessert ( )

Tues :       Meal 1 ( )                   Meal 2 ( )
           Dessert 1 ( )                 Dessert ( )
Run Code Online (Sandbox Code Playgroud)

然后应编制每张纸上的数据,告诉我们每个社区每天要准备多少种膳食...

这些表都是一样的,所以我希望能够扫描它们并自动读取它们.

我不知道任何允许我这样做的软件.完成此任务的最佳方法是什么?目前我正在研究tesseract,但也许有一些更简单的技术?

编辑:我们每周谈论几百个表格.理想情况下,我们将同时扫描它们,提取数据并以电子方式存储表格.

Ily*_*mov 10

您正在寻找OCR,这意味着要阅读机器打印的字符.您正在寻找ICR/OMR软件,也称为表单处理或数据捕获.OMR代表光学标记识别,这是您正在尝试做的,识别复选标记/复选框的值.

有关手写识别的其他信息,请参阅: 机器打印文本的ICR?

因为您的表单是相同的,这意味着您的表单属于"固定表单"类别,基于模板的软件包可以处理这些表单.这是一个简短的文档,解释了表单类型之间的差异:www.wisetrend.com/files/Structured_vs_Semi-Structured.pdf

您的空白表格本身也应该正确设计用于机器识别.它应该有参考标记,以便更好地对齐模板,清晰的流程,以便用户知道如何自然填充,检查适当大小的框等.

我相信FlexiCapture会做你需要的一切:链接.至少有几种其他解决方案可以执行类似的过程.我是纸质表格处理项目的集成商/顾问.

我删除了您的"移动"标签,因为我相信您不打算使用手机拍摄这些图像.如果你有,如果你有其他选择,我会反对.您提到在传统扫描仪上扫描它们,这是获得良好图像质量的最佳选择.相信我,在处理人工手写表单时,您将有足够的时间处理,因此尽可能优化表单,扫描,软件和流程.

如果您有兴趣自己开发,那就有可能.该过程是将图像区域(每个复选标记)与一些"基线"进行比较,以查看该区域是否有额外的手写.如果超过某个阈值,则检查复选标记.典型问题是区域对齐和临界阈值水平(小/浅刻度标记).商业包自动处理.

如果您需要任何其他指导,请告诉我.

伊利亚埃夫多基莫夫