首选开源,但不是必需的。
我有 Adobe Acrobat 8,并且非常喜欢 OCR 功能,它基本上可以在扫描文档的顶部放置一个不可见的 OCR 文本层。因此,您在屏幕上看到的是原始扫描文档,但结果是可搜索的。
我正在寻找的是一种自动化这个过程的方法。我目前有一些用于处理和存档扫描文件的脚本,并且正在寻找可以直接插入到此批处理过程中的一些脚本,以类似于我可以使用 Acrobat 执行的方式执行 OCR。
欢迎大家提出建议,谢谢!
pdf document-management ocr
document-management ×1
ocr ×1
pdf ×1