标签: ocr

以编程方式识别PDF文件中扫描的文本

我有一个PDF文件,其中包含我们需要导入数据库的数据.这些文件似乎是打印的字母数字文本的pdf扫描.看起来像10点.英语字体格式一种.

是否有任何工具或组件可以让我识别和解析此文本？

pdf ocr

Rob*_*Rob

2017 04-11

26
推荐指数

3
解决办法

5万
查看次数

使用python-tesseract获取已识别单词的边界框

我正在使用python-tesseract从图像中提取单词.这是tesseract的python包装器,它是一个OCR代码.

我使用以下代码来获取单词:

import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)

mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result

Run Code Online (Sandbox Code Playgroud)

这仅返回图像中的单词而不是它们的位置/大小/方向(或者换句话说,包含它们的边界框).我想知道是否有任何方法可以实现这一点

python ocr tesseract image-processing python-tesseract

Abt*_*ian

lucky-day

26
推荐指数

4
解决办法

4万
查看次数

如何执行文档自动裁剪使用相机识别图像？

我想制作一个类似凸轮扫描仪的应用程序来裁剪文档.

但我需要像我的两个图像一样的功能..

第一张图像显示相机拍摄的图像..

在此输入图像描述

第二个图像像这样识别捕获的图像部分.

在此输入图像描述

我研究得越来越多,但没有得到任何外出,所以,我在这里问,是否有任何人这样做告诉我..

谢谢

ocr android opencv crop

Roa*_*ies

2016 07-07

25
推荐指数

3
解决办法

3万
查看次数

从图像中删除背景噪音,使OCR的文字更清晰

我编写了一个应用程序,根据文本区域对图像进行分割,并根据需要提取这些区域.我试图做的是清洁图像,以便OCR(Tesseract)给出准确的结果.我将以下图像作为示例:

通过tesseract运行此结果会产生广泛不准确的结果.然而,清理图像(使用photoshop)获取图像如下:

给出我期望的结果.第一个图像已经通过以下方法运行,以清除它到那一点:

 public Mat cleanImage (Mat srcImage) {
    Core.normalize(srcImage, srcImage, 0, 255, Core.NORM_MINMAX);
    Imgproc.threshold(srcImage, srcImage, 0, 255, Imgproc.THRESH_OTSU);
    Imgproc.erode(srcImage, srcImage, new Mat());
    Imgproc.dilate(srcImage, srcImage, new Mat(), new Point(0, 0), 9);
    return srcImage;
}

Run Code Online (Sandbox Code Playgroud)

我还能做些什么来清理第一张图像,使其类似于第二张图像？

编辑:这是在运行该cleanImage功能之前的原始图像.

c++ java ocr opencv

Zy0*_*y0n

2015 11-25

25
推荐指数

2
解决办法

1万
查看次数

Tesseract使用4.0版本训练数据无法在Swift 3.0项目中工作

我正在尝试在新的Swift 3.0项目中使用Tesseract-OCR-iOS.我正在使用Xcode版本8.1(8B62).CocoaPods是1.1.1版.

当我尝试使用时tesseract.recognize(),我的应用程序崩溃,我在控制台中获得以下输出:

actual_tessdata_num_entries_ <= TESSDATA_NUM_ENTRIES:Error:Assert failed:in file tessdatamanager.cpp, line 53

Run Code Online (Sandbox Code Playgroud)

我发现这篇文章,听起来我使用的是错误的版本traineddata.我tessdata从tesseract-ocr/tessdata repo下载了,所以我很困惑为什么我的版本号不匹配.

任何建议如何让Tesseract工作非常感谢.以下是其他信息:我的设置.

这是我的Podfile样子:

# Uncomment the next line to define a global platform for your project
platform :ios, '9.0'

target 'TesseractDemo' do
  # Comment the next line if you're not using Swift and don't want to use dynamic frameworks
  use_frameworks!

  # Pods for TesseractDemo
pod 'TesseractOCRiOS', '4.0.0'

end

Run Code Online (Sandbox Code Playgroud)

我已将tessdata包含eng.traineddata …

ocr tesseract ios swift

Adr*_*ian

2016 12-16

25
推荐指数

1
解决办法

9434
查看次数

开源OCR

是否有用.NET编写的开源OCR库,或者用任何语言编写但可以在ASP.NET应用程序中使用？

.net ocr

作者

2008 10-13

24
推荐指数

1
解决办法

1万
查看次数

日本最准确的开源OCR？

根据您的经验,什么是最准确的开源光学字符识别(OCR)库/软件来阅读日文文本？

我刚试过nhocr,即使是非常干净的高清文档,它的错误率也超过了2%.

ocr open-source

Nic*_*oul

2012 04-30

24
推荐指数

1
解决办法

3万
查看次数

为什么Tesseract OCR库(iOS)根本无法识别文本？

我正在尝试Tesseract OCR在我的iOS应用程序中使用库.我从github下载了tesseract-ios库,当我试图识别一个简单的文本图像时,我得到了垃圾.这是我试图识别的图像:

在此输入图像描述

我的文字难以理解:

T0I1101T0W KIR1 H1I1101T0W KIR1 H1I1101T0W CIBEPS H1 ES PBHY P306 EHH11 133I R1 11335 11I1H1 19 13S SYIL 3B19 M H300H1911 H1113 AIR1 J1 OIII 3I9SH5H133IS 13V9 I1 Q1H211 E015 19 W331 H1 111SW

为什么Tesseract甚至无法识别简单的图像？这是我用来实例化Tesseract的代码:

Tesseract* tesseractObject = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];
[tesseractObject setVariableValue:@"0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ" forKey:@"tessedit_char_whitelist"];
[tesseractObject setImage:image];
[tesseractObject recognize];
NSLog(@"RECOGNISED= %@" , [tesseractObject recognizedText]);

Run Code Online (Sandbox Code Playgroud)

这是我的项目结构:

在此输入图像描述