OCR和单词审查

Thi*_*nka 7 ocr tesseract

我正在使用Tesseract进行我的字母识别项目,目前认可度非常好.图像处理部分使用OpenCv库完成.这些字母是手写的.但是当我用它来识别字母"O"和数字"0"时有一些问题.这些字母在数据区域中用作输入名称的字段.所以名字不能包含任何数字.当我们使用数据字段的系统作为出生日期时,它只包含数字.所以我愿意限制识别系统说相应的数据字段只有数字或字母.

而且我也愿意用可能的单词审查已识别的字母,这样我们就可以提高数据的准确性.我愿意使用openCv库来完成这项任务.但我不知道有哪些库可以帮助完成这项任务,以及这些库的功能是什么.所以请一些人帮助我.谢谢.

此致,提兰卡.

Nic*_*cue 3

我从来没有使用过 Tesseract。然而,在常见问题解答中它说

如何只识别数字?

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");
Run Code Online (Sandbox Code Playgroud)

想必您可以使用常见问题解答条目的模式来设置它,以便它仅正确识别字母或数字。

如果您已经尝试过此操作,您能否提供更多详细信息来说明为什么它不起作用?