Ash*_*Ash 15 c# ocr tesseract image-processing
好吧,我正在使用这个OCR的编译.NET版本,可以在@ http://www.pixel-technology.com/freeware/tessnet2/找到
我有它工作,但是这个目的是翻译车牌,遗憾的是引擎真的不能准确翻译一些字母,例如这里是我扫描的图像来确定字符问题

结果:
12345B7B9U ABCDEFGHIJKLMNUPIJRSTUVHXYZ
因此,以下字符被错误地翻译:
1,O,Q,W
这似乎并不太糟糕,但是在我的车牌上,结果并不是那么好:
= H4 ODM
= LDH IFW
假试验
= NR4 y2k
正如你可能会说的那样,我已经尝试过降噪,提高对比度,并删除不是绝对黑色的像素,没有真正的改进.
显然你可以"学习"引擎新的字体,但我想我需要重新编译.NET的库,似乎这是在我没有的Linux操作系统上执行的.
http://www.scribd.com/doc/16747664/Tesseract-Trainingfor-Khmer-LanguageFor-Posting
所以我不知道接下来会尝试什么,我写了一个快速的控制台应用程序纯粹是为了测试目的,如果有人想尝试它.如果有人有任何想法/图形处理/图书馆的想法,我很感激听到他们.
Emm*_*uel 28
我最近通过Tessnet2使用了Tesseract(如果我记得很清楚的话,Tessnet2是由RémyThomas制作的Tesseract 2.0的VS2008 C++包装器).让我试着帮助你掌握关于这个工具的一点知识:
1,正如我上面所说,这个包装器仅适用于Tesseract 2.0,Google Code上最新的Tesseract版本是3.00(代码不再托管在Source Forge上).有定期贡献者:我看到3.01左右的版本计划.因此,您不会受益于最后的增强功能,包括页面布局分析,这可能有助于您的车牌不是100%水平.
我向Rémy询问了版本3的Tessnet2 .NET包装器,他现在还没有计划.就像我一样,你必须自己做!
因此,如果您想获得最新版本的源代码,可以从Subversion存储库(专用网站页面上描述的所有内容)下载它们,如果您有Visual Studio 2008,您将能够编译它们,因为它们包含来源vs2008子文件夹中的VS2008解决方案.该解决方案由VS2008 C++项目组成,因此为了能够在C#中获得结果,您必须使用.NET P/Invoke与tessDll项目构建.再次,如果你需要这个,我有你可能感兴趣的代码示例,但你可能想继续使用C++并做自己的新WinForm项目,例如!
当你已经完成编译(不应该有重大问题,但告诉我,如果你遇到一些,我可能也遇到过它们:-)),你将输出几个二进制文件,这将允许你做一个具体培训!同样,有一个专门针对Tesseract 3培训的页面.通过此培训,您可以:
限制你的字符集,这将自动删除标点符号(例如'/ - \'而不是'A')
表示你已经检测到的含糊不清(你可以看到'D'而不是'O','B'而不是'8'等),当你使用训练时会考虑到这些含糊之处.
我还看到,如果你将图像限制在字母所在的区域(即没有脸,周围没有风景),Tesseract结果会更好:在我的情况下,我只需要识别从网络摄像头拍摄的特定卡片区域照片,所以我用图像处理来约束区域.当然,这很长,但我的图像来自许多不同的来源,所以我别无选择.如果你能将图像限制在最低限度,那就太棒了!
我希望它有任何帮助,不要犹豫,给我你的评论和问题!
Arn*_*eth 11
嗨我用tesseract做了很多ocr,我也有一些问题.你问一下图像处理工具,我建议"unpaper"(也有windows端口,请参阅谷歌)这是一个很好的去偏,无旋转,删除边框和噪声等等程序.非常适合在ocr'ing之前跑步.
如果你的图像上有一些(有些)可变的背景颜色,我会推荐"textcleaner"imagemagick脚本, 我认为它可以检测并清除所有非前卫的东西.
如果你有复杂的文字,那么"ocropus"可能是有用的.语法是(在linux上):"ocroscript rec-tess"
我的设置是1. textcleaner 2. unpaper 3. ocroups
通过这三个步骤,我几乎可以阅读任何内容.即使是在不均匀照明下拍摄的相当模糊+嘈杂的图像,两列紧凑的文字也非常易读.好吧也许你的需求不是那么多文本,但步骤1)和2)可能对你有用.
| 归档时间: |
|
| 查看次数: |
37505 次 |
| 最近记录: |