我正在使用Tesseract库阅读身份证信息.我尝试使用一些谷歌图像并取得了不错的效果,但当我去实时图像时,就是从iPhone相机拍摄图像时,我没有取得好成绩.
我找到了Tesseract建议的一些预处理步骤.
1.修复DPI(如果需要)300 DPI是最小的.
如何实时从iPhone摄像头捕获图像时如何设置图像的DPI?
2.修复文字大小(例如12磅应该没问题).
如何修复iPhone相机创建的大图像的文本大小?
3.尝试修复文本行(偏移校正和去扭曲文本).
我读到Tesseract使用Leptonica库应用了dewarp文本.在这个预处理阶段,文本需要消解或去偏移.
4.尝试修复图像的照明(例如,没有图像的暗部).
我可以使用OpenCV执行图像照明吗?
5.二值化和去噪图像.
当我为实时图像应用阈值或自适应阈值时,我得到了差的二值化图像.
如何将这些实时图像二值化?
我正在使用Tesseract Library从身份证信息中读取信息.我获得了每个单词或每行的置信度.

Box[0]: x=13, y=12, w=1134, h=57, confidence: 40, text: REPUYBLIQUE FRANCAISE
Box[1]: x=21, y=75, w=1119, h=50, confidence: 42, text: 7 NN99 3W F 59W
Box[2]: x=17, y=137, w=539, h=52, confidence: 30, text: V7 7 D5 NOM1BOHEL
Box[3]: x=6, y=189, w=954, h=46, confidence: 0, text:
Box[4]: x=12, y=239, w=1016, h=34, confidence: 40, text: 5 Q HV2 H CHRISTIANL NICBLE HBNIOIJE
Box[5]: x=21, y=310, w=975, h=53, confidence: 67, text: 2 E 20 06 1329
Box[6]: x=28, y=372, w=1043, h=83, confidence: 0, …Run Code Online (Sandbox Code Playgroud) 我在IOS中实现了tesseract ocr用于文本识别.我已经对输入图像进行了预处理并给出了Tesseract方法.它给出了较差的识别结果.
脚步:
1.侵蚀功能
2.Dilate功能
3.Bitwise_not功能
Mat MCRregion;
cv::dilate ( MCRregion, MCRregion, 24);
cv::erode ( MCRregion, MCRregion, 24);
cv::bitwise_not(MCRregion, MCRregion);
UIImage * croppedMCRregion = [self UIImageFromCVMat:MCRregion];
Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];
[tesseract setVariableValue:@"0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz.>,'`;-:</" forKey:@"tessedit_char_whitelist"];
[tesseract setImage:[self UIImageFromCVMat:MCRregion]];
// [tesseract setImage:image];
[tesseract recognize];
NSLog(@"%@", [tesseract recognizedText]);
Run Code Online (Sandbox Code Playgroud)
输入图片:
1.如何使用Tesseract提高文本识别率?
2.在Tesseract中应用了任何其他预处理步骤.
3.在Tesseract OCR中完成了褪色文本.?