如何OCR刻文?

Zah*_*dar 8 c# ocr pattern-recognition artificial-intelligence image-processing

我有这个形象

带刻图文字的图像

如何OCR呢?我知道这很有挑战性,但我真的很感激任何帮助.

Gur*_*geh 2

如果您有时间自己开发检测,我会大致这样做:

  1. 获取 1000 张左右的图像,然后自己进行 OCR 识别,或者让 Amazon Mechanical Turk 上的人员为您完成,这几乎不需要任何成本。现在您可以调整算法并衡量您的表现。
  2. 就像 Ryan 所写的那样,手动或使用http://www.roborealm.com/之类的东西来使用标准图像滤镜、对比度、颜色、高斯等。看看您是否无法找到使文本真正脱颖而出的组合。
  3. 再次尝试库
  4. 如果这些库仍然不起作用,请尝试利用您对图片的了解将其拆分为单独的数字。您知道应该有多少位数字以及每个数字大约需要多少像素。使用边缘检测或其他方法(也许标准 OCR 特征提取与聚类一起会将每个数字作为一个簇?)来查找数字并将它们分开。
  5. 对每个数字进行标准 OCR 特征提取(不要太有创意 - 使用现有库或至少阅读最常见和最简单的内容),并将这些特征与 1)下得到的答案一起输入神经网络网络或 SVM。
  6. 改进您的功能集,直到机器学习发挥作用。

由于您只有十位数字,而且图像之间相当一致,因此这应该可行。