能否让 Acrobat 11 使用多个 CPU 内核进行 OCR?

tar*_*an. 8 ocr multi-threaded adobe-acrobat cpu-cores

OCR 处理需要时间。使用多个 CPU 内核会加快处理速度。Acrobat 10不是多线程应用程序。Acrobat 11 怎么样?默认情况下,11 是否使用多个 CPU 内核进行 OCR(如果可用)?如果没有,是否有任何解决方法(例如编写脚本)来帮助 Acrobat 11 使用多个 CPU 内核执行 OCR?通过 Acrobat 的内置脚本语言或使用外部脚本启动和引导 Acrobat 的多个单线程实例并行执行部分处理作业。

注意:这个问题不是太本地化(不限于特定时间),因为 (1) Adob​​e 不会经常发布新的主要 Acrobat 版本(Acrobat 10 是两年前发布的)和 (2) Adob​​e Acrobat使用的应用程序。

tar*_*an. 6

我已经在 VirtualBox 中安装了Acrobat 11 (XI) 试用版。Acrobat 11 是单线程的。

我还制作了一个外部脚本,用于启动多个 Acrobat 实例(每个 CPU 内核一个),并行处理 OCR 作业并合并结果。一个关键步骤是在 Acrobat 首选项中打开错误日志记录,解析所有 .log 并重新处理任何错误文件。该脚本(使用 4 个内核时)执行 OCR 的速度仍然比 Acrobat 11 默认值快两倍。

  • 如果你愿意,你可以只提供来源。如果他们敢将其移除,则可以轻松恢复。 (4认同)

Isa*_*tch 1

多线程需要内置到应用程序中。开发人员必须编写代码来创建线程并将任务分解为可以分配给每个线程的子任务。如果 Acrobat 开发人员未能为其 OCR 识别代码执行此操作,则用户将无法创建所需的额外逻辑。

  • 如果它可以应用于页面范围,您可能可以尝试将工作划分为多个进程,每个进程仅对几页进行 OCR,然后将结果合并在一起。 (2认同)