开源方式实时图像处理OCR应用程序？

Question

我有一个应用程序,我想要生产.我们有壁挂式的时间表板,在白色背景上使用黑色线条分成小矩形.磁性名称标签放置在特定分区中以指示此人员将在该单元格中工作.该系统非常适合人们之间的通信,但我希望自动将这种计划信息保存到数据库中.

我正在设想一种系统,其中相机设置在固定位置,专注于计划板.相机会定期拍摄电路板的照片.我想写一些代码来破译哪个名称标签在哪个区域.这将需要一些OCR或符号识别.每个名称标签上都有大数字,我将用它来识别名称标签的人.

在处理新的编程问题时,我自然会去Python.我发现这个帖子 - > python图像识别,看起来像一个好的起点(使用PIL和numpy).

你知道这样做的好方法吗？

更新:我尝试过SimpleCV,现在似乎很好.

Answer 1

这实际上是一个相当困难的问题，尽管看起来很简单。但是，您可以通过对图像进行一些处理来使其变得易于管理，从而使其变得容易得多。我有以下建议：

尽量让你的相机用合理的镜头直视棋盘，这样边缘的图像失真最小，并且没有透视失真。
鉴于您偶尔会拍摄一些图像进行分析，我认为性能绝不是问题，因此请使用闪光灯或较长的曝光时间（因为您拍摄的所有内容都是静止的）拍摄高分辨率图像，以获得尽可能最佳的图像质量。
如果您期望的不同标签的数量不太大，您可能会发现尝试通过模板匹配来匹配图像中这些标签的参考图像比对数字进行完整的 OCR 更容易。如果您的图像足够好，那么工作起来会容易得多。python opencv接口非常完整。
High Performance Mark 对您关于在标签上包含条形码的问题给出了很好的评论。我会添加二维码选项，但这只是同一件事。两者都很容易检测，并且有很好的库可以帮助您阅读它们。
如果您确定确实需要 OCR，您应该查看可用的 OCR 软件包，而不是尝试自行推出。尝试使用pytesser作为tesseract引擎或OCRopus python 接口。