根据维基百科的说法,"对拉丁文字的准确识别,现在认为打字文本在可以获得清晰成像的应用程序(如扫描打印文档)方面被认为是一个很大的问题." 但是,它没有引用.
我的问题是:这是真的吗?目前最先进的技术是如此之好 - 对于良好的英文文本扫描 - 没有任何重大改进吗?
或者,这个问题的一个不那么主观的形式是:现代OCR系统在识别英文文本以获得高质量扫描时有多准确?
ocr text-extraction layout-extraction
layout-extraction ×1
ocr ×1
text-extraction ×1