如何更快地在iOS上进行tesseract?

n3u*_*ino 8 ocr performance tesseract ios

我正在努力与ios上的tesseract ocr.一切正常,但它真的很慢.单行数字的2 - 3秒识别时间.

我正在阅读视频流.

我正在使用tesseract 3.01和我的字体的自定义培训文件.

这是我做的:

设置tesseract只是为了找到数字(0-9)

  1. 收缩,歪斜和二值化图像
  2. 使用GetLines来找到我想要的文本行
  3. setRectangle 只识别我想要的线
  4. getUTF8Text得到我的文字< - 这一个人需要2-3秒

有没有建议加快这个过程?

n3u*_*ino 7

我切换到tesseract 3.02的SVN

在交叉编译遇到一些问题后,

对于getUTF8Text,我降低了约1.2 - 0.8秒,对于图像预处理,降低了0.3 - 0.2秒.

我做了一些测试

  • 二进制和收缩0.7增加0.3秒但成本为0.1
  • chop_enable = 0对平均速度增益为0.1的速度几乎没有影响,如果分析,它对50%的cpu使用量计算

可用性的主要好处是使用setRectangle优化代码,如果我怀疑边界不正确则不调用getUTF8Text.并通过检查接收到的字符串并应用一些算法来消除tesseract中最常见的误解,进行一些字符串后处理.

也许这对其他人有用.