标签: ocr

限制字符tesseract正在寻找

是否可以限制tesseract正在寻找的字符集(例如,仅搜索字母az)？这将极大地改善我的结果.

60
推荐指数

4
解决办法

7万
查看次数

什么是车牌检测的好算法？

背景

对于我在大学的最后一个项目,我正在开发车辆牌照检测应用程序.我认为自己是一名中级程序员,但是我的数学知识缺乏中学以上的任何东西,这使得生产正确的公式比它应该更难.

我花了很多时间查阅学术论文,例如:

谈到数学,我迷路了.由于这种测试,各种图形图像被证明是有效的,例如:

替代文字

至

替代文字

然而,这种方法仅适用于该特定图像,如果将这些技术应用于不同的图像,我确信会发生较差的转换.我读过一个名为"底帽形态变换"的公式,它执行以下操作:

基本上,变换保留了图片的所有暗部细节,并消除了其他一切(包括更大的暗区和亮区).

我找不到很多关于此的信息,但是报告末尾附近的文档中的图像显示了它的有效性.

其他限制

用C#开发
仅将项目限制在英国注册牌照
我可以选择要转换的图像作为演示

题

我需要建议我应该关注哪些转换技术,以及哪些算法可以帮助我.

编辑:关于续 - 车辆牌照检测的新信息

c# ocr image object-detection computer-vision

58
推荐指数

1
解决办法

5万
查看次数

如何在使用PHP的网站上实现OCR？

在Linux服务器上是否有任何可与PHP或Python一起使用的免费OCR库？我们的想法是能够上传图像并从中提取字符,或者允许用户"绘制字符",并将其从所述图像中解析出来.

php ocr fonts handwriting

57
推荐指数

2
解决办法

4万
查看次数

如何将tesseract只识别数字,当它们与字母混合时？

我想用它tesseract来识别数字.问题是我有数字和字母的混合,当我SetVariable("tessedit_char_whitelist", "0123456789")
用于每个符号时,tesseract返回错误的数字.

我可以设置一个阈值,以便tesseract省略低相似性的符号吗？

注意:我设置tesseract只识别数字,因此O和0之间没有混淆.

55
推荐指数

6
解决办法

8万
查看次数

将Vision VNTextObservation转换为String

我正在浏览Apple的Vision API文档,我看到了几个与文本检测有关的类UIImages:

1) class VNDetectTextRectanglesRequest

2) class VNTextObservation

看起来他们可以检测到角色,但我没有看到对角色做任何事情的方法.一旦你检测到了角色,你会如何将它们变成可被解释的东西NSLinguisticTagger？

这是一篇简短的概述Vision.

谢谢你的阅读.

ocr machine-learning ios nslinguistictagger apple-vision

54
推荐指数

4
解决办法

2万
查看次数

如何在Windows中的光标下获取单词？

我想创建一个应用程序,它获取光标下的单词(不仅仅是文本字段),但我找不到如何做到这一点.使用OCR非常困难.我见过的唯一工作就是Deskperience组件.他们支持'本土'方式,但我花了很多钱.现在我想弄清楚这种"原生"方式是什么(也许某种程度上是挂钩).任何帮助将不胜感激.

编辑: 我找到了一种方法,但它只获得控件的整个文本.知道如何只从整个文本中获取光标下的单词吗？

c# windows ocr hook winapi

49
推荐指数

4
解决办法

1万
查看次数

我应该在Android中使用哪种OCR Java库？

我想构建一个Android应用程序,通过OCR库,它应该扫描从中提取文本的图片.

我应该使用什么Java库？

java ocr android

41
推荐指数

3
解决办法

6万
查看次数

数学公式的OCR库

我需要一个开放的OCR库,它能够扫描复杂的打印数学公式(例如通过LaTeX生成的一些公式).我想获得一些类似LaTeX的输出(或者只是一些类似AST的数据).

有没有这样的东西？或者当前的OCR技术是否能够解析面向行的文本？

(请注意,我也在Metaoptimize上发布了这个问题,因为那里的某些人可能还有其他知识.)

这个问题也被OpenAI描述为im2latex.

41
推荐指数

4
解决办法

4万
查看次数

通过OCR从T恤的照片中提取代码

我最近看到有人穿着T恤背面有一些Perl代码.我拍了一张照片并裁剪出代码:

替代文字

接下来我尝试通过OCR从图像中提取代码,因此我安装了Tesseract OCR和Python绑定,pytesser.

Pytesser仅适用于TIFF图像,因此我在Gimp中转换了图像并输入以下代码(Ubuntu 9.10):

>>> from pytesser import *
>>> image = Image.open('code.tif')
>>> print image_to_string(image)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "pytesser.py", line 30, in image_to_string
    util.image_to_scratch(im, scratch_image_name)
  File "util.py", line 7, in image_to_scratch
    im.save(scratch_image_name, dpi=(200,200))
  File "/usr/lib/python2.6/dist-packages/PIL/Image.py", line 1406, in save
    save_handler(self, fp, filename)
  File "/usr/lib/python2.6/dist-packages/PIL/BmpImagePlugin.py", line 197, in _save
    raise IOError("cannot write mode %s as BMP" % im.mode)
IOError: cannot write mode RGBA as BMP
>>> …

Run Code Online (Sandbox Code Playgroud)

python ocr tesseract

39
推荐指数

6
解决办法

3945
查看次数

Android OCR库

有没有人知道可用于开发应用程序的任何可用库或示例代码,这些应用程序读取相机捕获的图像中的文本？类似于Google Goggles的东西,但仅用于阅读文字.

ocr android image-processing

39
推荐指数

3
解决办法

7万
查看次数

标签统计

ocr ×10

c# ×2

apple-vision ×1

computer-vision ×1

handwriting ×1

hook ×1

image-processing ×1

ios ×1

java ×1

machine-learning ×1

nslinguistictagger ×1

object-detection ×1

php ×1

«
1
2
3
4
5
…
77
»