iPhone上的数字识别是否可以实时实现?

Mit*_*Lap 9 iphone ocr tesseract vision

我需要实时识别iPhone上相机图像中的数字.我知道图像上的数字不会超过5位.

鉴于iPhone的计算规格,这个问题是否切合实际?有没有人有使用Tesseract OCR库的经验,您认为可以通过使用它来解决吗?

Bra*_*son 11

这取决于你对"实时"的定义,但是,应该可以相对快速地识别iPhone 4上的数字0-9,特别是如果你可以使用字体,照明条件等等.出现在.

我强烈推荐阅读有关Sudoku Grab如何使用iPhone相机识别谜题的文章.在他们的情况下,使用经过训练的神经网络来识别数字,这在现代iOS硬件上应该相当简单和快速.

目前的识别库,如OpenCV,将使用iPhone的CPU进行处理.我听说他们可以做更复杂的任务,比如面部识别速度足够快,可以与视频源一起使用,同时显示最少量的口吃.

为了获得更好的性能,我相信在新的iOS设备上可编程GPU有很多潜力.在我的基准测试中,当使用iPhone 4的GPU进行简单的图像处理时,我看到了14倍-28倍的加速.虽然现在很少有人在看这个,但像Sudoku Grab的神经网络这样的东西应该是一个足够平行的过程,可以从GPU上运行中受益.


Ale*_*rgo 1

计算上应该是可以的。有些应用程序可以实时获取条形码,也有一个应用程序可以进行实时翻译。(字镜头)。不过,我不确定他们使用什么库。