小编bal*_*nna的帖子

改进Tesseract OCR中的预处理步骤以实现实时捕获

我正在使用Tesseract库阅读身份证信息.我尝试使用一些谷歌图像并取得了不错的效果,但当我去实时图像时,就是从iPhone相机拍摄图像时,我没有取得好成绩.

我找到了Tesseract建议的一些预处理步骤.

1.修复DPI(如果需要)300 DPI是最小的.

如何实时从iPhone摄像头捕获图像时如何设置图像的DPI？

2.修复文字大小(例如12磅应该没问题).

如何修复iPhone相机创建的大图像的文本大小？

3.尝试修复文本行(偏移校正和去扭曲文本).

我读到Tesseract使用Leptonica库应用了dewarp文本.在这个预处理阶段,文本需要消解或去偏移.

4.尝试修复图像的照明(例如,没有图像的暗部).

我可以使用OpenCV执行图像照明吗？

5.二值化和去噪图像.

当我为实时图像应用阈值或自适应阈值时,我得到了差的二值化图像.

如何将这些实时图像二值化？

ocr tesseract ios

bal*_*nna

2015 04-16

7
推荐指数

1
解决办法

798
查看次数

如何使用Tesseract OCR读取身份证中的单词.

我正在使用Tesseract Library从身份证信息中读取信息.我获得了每个单词或每行的置信度.

图片链接

Box[0]: x=13, y=12, w=1134, h=57, confidence: 40, text: REPUYBLIQUE FRANCAISE

Box[1]: x=21, y=75, w=1119, h=50, confidence: 42, text:    7  NN99 3W F 59W

Box[2]: x=17, y=137, w=539, h=52, confidence: 30, text:   V7 7  D5 NOM1BOHEL

Box[3]: x=6, y=189, w=954, h=46, confidence: 0, text: 
Box[4]: x=12, y=239, w=1016, h=34, confidence: 40, text:      5   Q  HV2 H CHRISTIANL NICBLE  HBNIOIJE

Box[5]: x=21, y=310, w=975, h=53, confidence: 67, text:   2 E    20 06 1329

Box[6]: x=28, y=372, w=1043, h=83, confidence: 0, …

Run Code Online (Sandbox Code Playgroud)

ocr tesseract ios

bal*_*nna

2014 09-05

7
推荐指数

1
解决办法

2746
查看次数

如何使用Tesseract OCR改进文本识别.

我在IOS中实现了tesseract ocr用于文本识别.我已经对输入图像进行了预处理并给出了Tesseract方法.它给出了较差的识别结果.

脚步:

1.侵蚀功能

2.Dilate功能

3.Bitwise_not功能

 Mat MCRregion;
 cv::dilate ( MCRregion, MCRregion, 24);
 cv::erode ( MCRregion, MCRregion, 24);
 cv::bitwise_not(MCRregion, MCRregion);

 UIImage * croppedMCRregion = [self UIImageFromCVMat:MCRregion];

    Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];
    [tesseract setVariableValue:@"0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz.>,'`;-:</" forKey:@"tessedit_char_whitelist"];
    [tesseract setImage:[self UIImageFromCVMat:MCRregion]];
    //                [tesseract setImage:image];
    [tesseract recognize];

    NSLog(@"%@", [tesseract recognizedText]);

Run Code Online (Sandbox Code Playgroud)

输入图片:

图片链接

1.如何使用Tesseract提高文本识别率？

2.在Tesseract中应用了任何其他预处理步骤.

3.在Tesseract OCR中完成了褪色文本.？

opencv tesseract objective-c ios

bal*_*nna

2014 08-28

3
推荐指数

2
解决办法

4877
查看次数