我正在创建一个监视文件夹以查找扫描文件的服务.文件存在后,服务会将其选中,然后将其转换为可读的PDF.在此过程中,服务还会搜索条形码.在此之后,提取文本并将文本及其文本存储到我们软件的数据库中.该位置基于条形码.
现在,对于OCR,我们使用的是Atalasoft的SDK(http://www.atalasoft.com/).条形码识别器也包含在此SDK中.
但转换后的文本仍有一些错误.(我用其他OCR程序进行了一些测试,但是Atalasoft表现得很好.)我正在寻找一些软件(SDK-kit),它可以让我提高PDF的质量以达到OCR目的.
我测试了Kofax VRS Elite(http://www.kofax.com/vrs-virtualrescan/).我正在寻找类似的东西,但可以使用某种SDK-kit在服务中实现.
以前做过这个或有过类似问题的人?提前thx!