Tesseract或任何其他OCR库

Question

Tesseract或任何其他OCR库

sno*_*kin 7 c++ ocr tesseract image-recognition

我正在寻找一个解释/ API doc /如何在C++中使用(并训练？)Tesseract的例子,在google Tesseract页面上没什么用处,还能在网上找到一些东西.

任何有用的资源,经验都会受到欢迎,因为我不知道如何开始.

PS:

我对其他图书馆的建议持开放态度.
只有免费图书馆

Answer 1

Ric*_*olf 4

我对 Tesseract 有一些经验...一个简单的“训练 tesseract”谷歌显示了此页面： http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract ，您必须在其中选择您想要的 tesseract 版本训练.. 虽然 3 是最新版本，但它是全新的，因此人们仍在解决任何问题 - 我仍在使用版本 2.4。不管怎样，你会看到针对特定的“语言”（或者应该被称为“字体”或“字符集”）训练超立方体大约有 9 个步骤。您也可以只使用现有的“eng”语言 - 但这取决于您的应用程序。例如，在我的应用程序中，我必须进行文档分析并获取特定区域，并希望 OCR 一个 13 个字符的数字字符串 - 而且我需要高精度 - 并且我不希望它将“5”读作“ S' 和 '0' 为 'O' 等，因此为我的特定字体集创建仅包含字符 0..9 的特定“语言”是合乎逻辑的，而您可能不关心是否会收到额外的“噪音”

归档时间：	15 年，7 月前
查看次数：	4221 次
最近记录：	8 年，6 月前