是否可以限制tesseract正在寻找的字符集(例如,仅搜索字母az)?这将极大地改善我的结果.
对于我在大学的最后一个项目,我正在开发车辆牌照检测应用程序.我认为自己是一名中级程序员,但是我的数学知识缺乏中学以上的任何东西,这使得生产正确的公式比它应该更难.
我花了很多时间查阅学术论文,例如:
谈到数学,我迷路了.由于这种测试,各种图形图像被证明是有效的,例如:

至

然而,这种方法仅适用于该特定图像,如果将这些技术应用于不同的图像,我确信会发生较差的转换.我读过一个名为"底帽形态变换"的公式,它执行以下操作:
基本上,变换保留了图片的所有暗部细节,并消除了其他一切(包括更大的暗区和亮区).
我找不到很多关于此的信息,但是报告末尾附近的文档中的图像显示了它的有效性.
我需要建议我应该关注哪些转换技术,以及哪些算法可以帮助我.
编辑:关于续 - 车辆牌照检测的新信息
在Linux服务器上是否有任何可与PHP或Python一起使用的免费OCR库?我们的想法是能够上传图像并从中提取字符,或者允许用户"绘制字符",并将其从所述图像中解析出来.
我想用它tesseract来识别数字.问题是我有数字和字母的混合,当我SetVariable("tessedit_char_whitelist", "0123456789")
用于每个符号时,tesseract返回错误的数字.
我可以设置一个阈值,以便tesseract省略低相似性的符号吗?
注意:我设置tesseract只识别数字,因此O和0之间没有混淆.
我正在浏览Apple的Vision API文档,我看到了几个与文本检测有关的类UIImages:
1) class VNDetectTextRectanglesRequest
看起来他们可以检测到角色,但我没有看到对角色做任何事情的方法.一旦你检测到了角色,你会如何将它们变成可被解释的东西NSLinguisticTagger?
这是一篇简短的概述Vision.
谢谢你的阅读.
我想创建一个应用程序,它获取光标下的单词(不仅仅是文本字段),但我找不到如何做到这一点.使用OCR非常困难.我见过的唯一工作就是Deskperience组件.他们支持'本土'方式,但我花了很多钱.现在我想弄清楚这种"原生"方式是什么(也许某种程度上是挂钩).任何帮助将不胜感激.
编辑: 我找到了一种方法,但它只获得控件的整个文本.知道如何只从整个文本中获取光标下的单词吗?
我想构建一个Android应用程序,通过OCR库,它应该扫描从中提取文本的图片.
我应该使用什么Java库?
我需要一个开放的OCR库,它能够扫描复杂的打印数学公式(例如通过LaTeX生成的一些公式).我想获得一些类似LaTeX的输出(或者只是一些类似AST的数据).
有没有这样的东西?或者当前的OCR技术是否能够解析面向行的文本?
(请注意,我也在Metaoptimize上发布了这个问题,因为那里的某些人可能还有其他知识.)
这个问题也被OpenAI描述为im2latex.
我最近看到有人穿着T恤背面有一些Perl代码.我拍了一张照片并裁剪出代码:

接下来我尝试通过OCR从图像中提取代码,因此我安装了Tesseract OCR和Python绑定,pytesser.
Pytesser仅适用于TIFF图像,因此我在Gimp中转换了图像并输入以下代码(Ubuntu 9.10):
>>> from pytesser import *
>>> image = Image.open('code.tif')
>>> print image_to_string(image)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "pytesser.py", line 30, in image_to_string
util.image_to_scratch(im, scratch_image_name)
File "util.py", line 7, in image_to_scratch
im.save(scratch_image_name, dpi=(200,200))
File "/usr/lib/python2.6/dist-packages/PIL/Image.py", line 1406, in save
save_handler(self, fp, filename)
File "/usr/lib/python2.6/dist-packages/PIL/BmpImagePlugin.py", line 197, in _save
raise IOError("cannot write mode %s as BMP" % im.mode)
IOError: cannot write mode RGBA as BMP
>>> …Run Code Online (Sandbox Code Playgroud) 有没有人知道可用于开发应用程序的任何可用库或示例代码,这些应用程序读取相机捕获的图像中的文本?类似于Google Goggles的东西,但仅用于阅读文字.