我有一个客户的要求,他们希望为不同地区的老人提供膳食.为此,人们根据每天的选择填写一周的表格并勾选方框(它还考虑了具体要求).
例如 :
Name
Commune
With salt ( ) Without salt []
Mon : Meal 1 ( ) Meal 2 ( )
Dessert 1 ( ) Dessert ( )
Tues : Meal 1 ( ) Meal 2 ( )
Dessert 1 ( ) Dessert ( )
Run Code Online (Sandbox Code Playgroud)
然后应编制每张纸上的数据,告诉我们每个社区每天要准备多少种膳食...
这些表都是一样的,所以我希望能够扫描它们并自动读取它们.
我不知道任何允许我这样做的软件.完成此任务的最佳方法是什么?目前我正在研究tesseract,但也许有一些更简单的技术?
编辑:我们每周谈论几百个表格.理想情况下,我们将同时扫描它们,提取数据并以电子方式存储表格.
Ily*_*mov 10
您正在寻找OCR,这意味着要阅读机器打印的字符.您正在寻找ICR/OMR软件,也称为表单处理或数据捕获.OMR代表光学标记识别,这是您正在尝试做的,识别复选标记/复选框的值.
有关手写识别的其他信息,请参阅: 机器打印文本的ICR?
因为您的表单是相同的,这意味着您的表单属于"固定表单"类别,基于模板的软件包可以处理这些表单.这是一个简短的文档,解释了表单类型之间的差异:www.wisetrend.com/files/Structured_vs_Semi-Structured.pdf
您的空白表格本身也应该正确设计用于机器识别.它应该有参考标记,以便更好地对齐模板,清晰的流程,以便用户知道如何自然填充,检查适当大小的框等.
我相信FlexiCapture会做你需要的一切:链接.至少有几种其他解决方案可以执行类似的过程.我是纸质表格处理项目的集成商/顾问.
我删除了您的"移动"标签,因为我相信您不打算使用手机拍摄这些图像.如果你有,如果你有其他选择,我会反对.您提到在传统扫描仪上扫描它们,这是获得良好图像质量的最佳选择.相信我,在处理人工手写表单时,您将有足够的时间处理,因此尽可能优化表单,扫描,软件和流程.
如果您有兴趣自己开发,那就有可能.该过程是将图像区域(每个复选标记)与一些"基线"进行比较,以查看该区域是否有额外的手写.如果超过某个阈值,则检查复选标记.典型问题是区域对齐和临界阈值水平(小/浅刻度标记).商业包自动处理.
如果您需要任何其他指导,请告诉我.
伊利亚埃夫多基莫夫