实时图像处理(OCR)

Ab'*_*tio 15 iphone ocr image-processing augmented-reality ios

我正计划开发像Word Lens这样的应用程序.任何人都可以建议我可以使用的好图书馆吗?或任何人解释Word Lens App背后的技术?是卷轴时间图像匹配还是OCR?我知道一些图像处理库,如OpenCv,tesseract ...非常感谢任何帮助......

jd.*_*jd. 42

我是Word Lens的创造者之一.虽然有一些OCR库(如tesseract),但我们决定自己创建,以获得更好的结果和性能.我们的通用算法是这样的:

  1. 从相机复制图像并获取其灰度分量
  2. 平整图像,使文本在背景中清晰突出
  3. 在看起来像字符和句子的东西周围画框
  4. 做OCR:将每个框中的像素与字符数据库相匹配 - 这实际上非常难!
  5. 将字符收集到单词中,在字典中查找(这也很难,因为OCR中会出现错误)
  6. 将结果绘制回图像

图像匹配本身并不够好,因为那里有各种各样的字体,文字和语言.

OpenCV是一个很好的图书馆,可以启动和运行,并且可以了解更多关于计算机视觉的信息.我建议建立他们的例子,并在那里玩.玩得开心!