sno*_*kin 7 c++ ocr tesseract image-recognition
我正在寻找一个解释/ API doc /如何在C++中使用(并训练?)Tesseract的例子,在google Tesseract页面上没什么用处,还能在网上找到一些东西.
任何有用的资源,经验都会受到欢迎,因为我不知道如何开始.
PS:
我对 Tesseract 有一些经验...一个简单的“训练 tesseract”谷歌显示了此页面: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract ,您必须在其中选择您想要的 tesseract 版本训练.. 虽然 3 是最新版本,但它是全新的,因此人们仍在解决任何问题 - 我仍在使用版本 2.4。不管怎样,你会看到针对特定的“语言”(或者应该被称为“字体”或“字符集”)训练超立方体大约有 9 个步骤。您也可以只使用现有的“eng”语言 - 但这取决于您的应用程序。例如,在我的应用程序中,我必须进行文档分析并获取特定区域,并希望 OCR 一个 13 个字符的数字字符串 - 而且我需要高精度 - 并且我不希望它将“5”读作“ S' 和 '0' 为 'O' 等,因此为我的特定字体集创建仅包含字符 0..9 的特定“语言”是合乎逻辑的,而您可能不关心是否会收到额外的“噪音”
| 归档时间: |
|
| 查看次数: |
4221 次 |
| 最近记录: |