Tesseract数字识别:什么是最常见的OCR选项

Nir*_*att 5 ocr tesseract image-recognition number-recognition ios

这是我通过Tesseract引擎进行数字识别的iOS OCR代码:

Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];

//set the tesseract variables
[tesseract setVariableValue:@"0123456789" forKey:@"tessedit_char_whitelist"];

NSString * temp = @"7";
[tesseract setVariableValue:temp forKey:@"tessedit_pageseg_mode"];

[tesseract setImage:argImage];
[tesseract recognize];
m_convertedText = [[tesseract recognizedText] copy];
Run Code Online (Sandbox Code Playgroud)

使用上面,我得到一些正确的图像.但是有时我会得到5而不是8,6而不是5等等.我的输入图像非常完美 - 二值化后的纯黑色和白色.

我还缺少其他任何Tesseract选项吗?我看到有600多个选项和非常稀疏的文档.

我能找到的最好的是这个网站列出了所有选项,但对于OCR初学者来说还不是很清楚.

如果有人通过使用tesseract的数字OCR达到了100%的准确率,那将非常有帮助.