标签: ocr

OpenCV-Python中的简单数字识别OCR

我正在尝试在OpenCV-Python(cv2)中实现"数字识别OCR".它仅用于学习目的.我想在OpenCV中学习KNearest和SVM功能.

我有每个数字的100个样本(即图像).我想和他们一起训练.

letter_recog.pyOpenCV示例附带了一个示例.但我仍然无法弄清楚如何使用它.我不明白什么是样本,响应等.另外,它首先加载一个txt文件,我首先不明白.

稍后搜索一下,我可以在cpp示例中找到一个letter_recognition.data.我使用它并在letter_recog.py模型中为cv2.KNearest创建了一个代码(仅用于测试):

import numpy as np
import cv2

fn = 'letter-recognition.data'
a = np.loadtxt(fn, np.float32, delimiter=',', converters={ 0 : lambda ch : ord(ch)-ord('A') })
samples, responses = a[:,1:], a[:,0]

model = cv2.KNearest()
retval = model.train(samples,responses)
retval, results, neigh_resp, dists = model.find_nearest(samples, k = 10)
print results.ravel()
Run Code Online (Sandbox Code Playgroud)

它给了我一个20000的数组,我不明白它是什么.

问题:

1)letter_recognition.data文件是什么?如何从我自己的数据集构建该文件?

2)什么results.reval()表示?

3)我们如何使用letter_recognition.data文件(KNearest或SVM)编写简单的数字识别工具?

python ocr opencv numpy computer-vision

370
推荐指数
3
解决办法
21万
查看次数

reCaptcha是否遭到破解/黑客攻击/ OCR /被击败/破坏?

有没有使用任何编程方法来击败reCAPTCHA?

我很有兴趣看到证据和潜在的演示,特别是reCAPTCHA已被完全自动化,无人化的方法淘汰.

澄清一点,不是寻找以任何方式涉及人类的reCAPTCHA作弊解决方案,是否负责填写CAPCHA,色情搜索者或Mechanical Turk.

也不是在寻找reCAPTCHA的替代品,比如选择动物类型,或者背景字段或javascript技巧.

security ocr captcha recaptcha

173
推荐指数
10
解决办法
7万
查看次数

Java OCR实现

这主要只是好奇心,但纯Java中是否有任何OCR实现?我很好奇这将如何纯粹用Java表现,而OCR一般对我感兴趣,所以我很想看看它是如何用我完全理解的语言实现的.当然,这需要实现是开源的,但我仍然对专有解决方案感兴趣,因为我至少可以检查这种情况下的性能.

我见过一些可以在Java中使用的东西(比如Asprise),但似乎这些都不是纯粹的Java实现......有没有?

java ocr

157
推荐指数
5
解决办法
20万
查看次数

Android有免费的OCR库吗?

我正在寻找在Android上运行的Java OCR,但是Asprise似乎不是一个独立于平台的OCR.有没有我可以用于Android应用程序开发的开源/免费Java OCR?

ocr android

146
推荐指数
4
解决办法
14万
查看次数

图像处理,以提高tesseract OCR的准确性

我一直在使用tesseract将文档转换为文本.文档的质量范围非常广泛,我正在寻找有关哪种图像处理可能会改善结果的提示.我注意到高度像素化的文本 - 例如由传真机生成的文本 - 对于tesseract来说特别难以处理 - 可能是角色的所有锯齿状边缘都会混淆形状识别算法.

什么样的图像处理技术可以提高准确度?我一直在使用高斯模糊来平滑像素化图像并看到一些小的改进,但我希望有更具体的技术可以产生更好的结果.假设一个过滤器被调整为黑白图像,这将平滑不规则的边缘,然后是一个过滤器,它会增加对比度,使角色更加清晰.

对于图像处理新手的任何一般提示?

ocr tesseract image-processing

127
推荐指数
9
解决办法
13万
查看次数

如何在Tesseract和OpenCV之间进行选择?

我最近遇到了TesseractOpenCV.看起来Tesseract是一个成熟的OCR引擎,OpenCV可以用作创建OCR应用程序/服务的框架.

我尝试在我的一些图像上使用Tesseract,它的准确性似乎不错.后来,我遇到了一个非常简单的使用OpenCV来使用Python执行OCR的教程,并给人留下了深刻的印象.几分钟后,我完成了系统的培训,其准确性很好.但是,当然,采用这种方法意味着我需要使用大型训练集来广泛训练我的系统.

我的具体问题如下:

  • 如何在Tesseract和使用OpenCV构建自定义OCR应用程序之间进行选择?
  • 有针对不同语言的Tesseract提供的培训数据集.OpenCV是否有类似的东西,以便我不必开始实现OCR?
  • 对于想成为商业应用程序哪个更好?

有什么建议?

注意:我24小时在计算机视觉领域,但我愿意花时间和精力学习先决条件.

python ocr opencv tesseract computer-vision

86
推荐指数
3
解决办法
6万
查看次数

如何让索引服务和MODI在OCR上生成全文?

我已配置索引服务来索引我的文件,其中还包括保存为高分辨率TIFF文件的扫描图像.我还安装了MS Office 2003+并正确配置了MS Office Document Imaging(MODI),因此我可以对我的图像执行OCR,甚至将OCR文本嵌入到TIFF中.

索引服务能够索引和查找那些手动OCR并使用文本数据重新保存的TIFF(使用MS Document Imaging工具).

事实证明,与Windows XP SP2一起部署的数据执行保护(DEP)认为MODI是恶意的,并且拒绝让它发挥其魔力.我已经能够通过完全关闭DEP来使它工作,但我发现这个解决方案不够优雅.

有没有更好的解决方案来实现这项工作,而不会禁用DEP?

ocr modi indexing-service

71
推荐指数
1
解决办法
2053
查看次数

android中最好的OCR(光学字符识别)示例

我想在android中运行OCR的一个例子,我做了一些研究并找到了一个在android中实现OCR的例子.

https://github.com/rmtheis/tess-two,其中有三个项目文件......

  1. 眼睛二
  2. 苔丝二
  3. 苔丝个测试

我通过导入三个项目文件执行了"tess-two-test"项目,但"tess-two-test"不包含任何活动,因此不会运行.

有人能给我一个更好的例子吗?

ocr android tesseract

68
推荐指数
1
解决办法
12万
查看次数

如何从图像中识别车牌/号牌(ANPR)?

我有一个网站,允许用户上传汽车的图像,我想放置一个隐私过滤器来检测车辆上的登记牌并模糊它们.

模糊不是问题,但有一个库或组件(首选开源)有助于在照片中找到许可证吗?

注意事项;

  1. 我知道没有什么是完美的,这种类型的图像识别将提供误报和否定.
  2. 我感谢我们可以要求用户选择要模糊的区域,我们也会这样做,但问题是关于以编程方式查找数据; 所以诸如"让一个人检查每个图像"之类的答案是没有用的.
  3. 这种软件方法在英国被称为"自动车牌识别",但我看不出它作为库的任何实现.
  4. 虽然.Net是首选,但任何语言都很棒.

ocr image computer-vision anpr

67
推荐指数
6
解决办法
10万
查看次数

Tesseract运行错误

我在linux上运行tesseract-ocr引擎时遇到问题.我已经下载了RUS语言数据并将其放到tessdata目录(/ usr/local/share/tessdata).当我尝试使用命令运行tesseract时tesseract blob.jpg out -l rus,它会显示错误:

Error opening data file /usr/local/share/tessdata/eng.traineddata

Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.

Failed loading language eng
Tesseract couldn't load any languages!

Could not initialize tesseract.
Run Code Online (Sandbox Code Playgroud)

根据编译指南,我曾经export TESSDATA_PREFIX='/usr/local/share/' 指向我的tessdata目录.也许我应该编辑任何配置文件?Tesseract尝试加载'eng'数据文件而不是'rus'.

截图:http: //i.stack.imgur.com/I0Guc.png

ocr tesseract

65
推荐指数
8
解决办法
8万
查看次数