有可行的手写识别库/程序吗?

scr*_*Owl 6 java ocr r machine-learning

我正在寻找处理一堆扫描的响应明信片,上面有手写的联系信息(即姓名,地址,电话,电子邮件等).

我很好奇是否有可行的开源库或软件来完成这项工作(理想情况下是Java或R).在环顾四周时,很多信息都来自2009年或早期,并不是很令人鼓舞.

语言是英语.

有什么建议?

编辑:我看过OCRopus页面,但最新版本是从2009年5月开始.任何人都有这方面的经验或者是否有更新的版本?

Nik*_*lay 2

首先,据我所知,没有原生开源 Java OCR SDK。有一些 Java API 包装了对本机接口、tesjeract ( http://code.google.com/p/tesjeract/ ) 或 Tess4J ( http://tess4j.sf.net/ ) 的调用。

接下来,您需要指定是查找手写文本还是手印文本。如果您需要手写文本识别 - 由于其他答案中所述的原因,我不相信您能够解决您的任务。

但是,如果您需要 ICR(代表智能字符识别)来处理手写文本(调查、表格等中使用的清晰字母),可能有一个解决方案。虽然我相信 tesseract(尽管被认为是开源引擎中最好的)无法胜任您的工作,但您可以寻找更准确的 SDK。

也许这个问题会有所帮助:手写扫描文档到.txt 文件?