tar*_*an. 8 ocr multi-threaded adobe-acrobat cpu-cores
OCR 处理需要时间。使用多个 CPU 内核会加快处理速度。Acrobat 10不是多线程应用程序。Acrobat 11 怎么样?默认情况下,11 是否使用多个 CPU 内核进行 OCR(如果可用)?如果没有,是否有任何解决方法(例如编写脚本)来帮助 Acrobat 11 使用多个 CPU 内核执行 OCR?通过 Acrobat 的内置脚本语言或使用外部脚本启动和引导 Acrobat 的多个单线程实例并行执行部分处理作业。
注意:这个问题不是太本地化(不限于特定时间),因为 (1) Adobe 不会经常发布新的主要 Acrobat 版本(Acrobat 10 是两年前发布的)和 (2) Adobe Acrobat使用的应用程序。
我已经在 VirtualBox 中安装了Acrobat 11 (XI) 试用版。Acrobat 11 是单线程的。
我还制作了一个外部脚本,用于启动多个 Acrobat 实例(每个 CPU 内核一个),并行处理 OCR 作业并合并结果。一个关键步骤是在 Acrobat 首选项中打开错误日志记录,解析所有 .log 并重新处理任何错误文件。该脚本(使用 4 个内核时)执行 OCR 的速度仍然比 Acrobat 11 默认值快两倍。
多线程需要内置到应用程序中。开发人员必须编写代码来创建线程并将任务分解为可以分配给每个线程的子任务。如果 Acrobat 开发人员未能为其 OCR 识别代码执行此操作,则用户将无法创建所需的额外逻辑。
| 归档时间: |
|
| 查看次数: |
4685 次 |
| 最近记录: |