Tesseract(OCR引擎)是否可以重入?

Hri*_*tov 7 ocr concurrency tesseract reentrancy

我在四核处理器上使用Tesseract进行OCR.为了更好的速度,我想一次读4个单词,使用4个线程.同时从多个线程调用Tesseract是否安全?

注意:每个线程将处理不同的非共享映像.

注意:由于速度的原因,用锁保护是不行的.

Kao*_*ire 7

发行说明来看,Tesseract(主要是,并且在某种程度上,您描述需要)从3.01开始是线程安全的(2011年10月21日)

线程安全!将所有关键全局变量和静态变为适当类的成员.Tesseract现在是线程安全的(多个实例可以在多个线程中并行使用.),但有一些控制参数仍然是全局的,并影响所有线程.

我已经成功地在多个核心上使用它了很长时间(或者更长,来自dev分支).


Mau*_*fer 3

我不认为 tesseract 目前是可并行的(请参阅此线程),尽管 v3.0 的主要目标之一是使其更加线程安全

但是,您始终可以通过运行n 个并发的tesseract进程来进行并行化。如果您想并行化单个图像的 OCRing,则需要将其拆分并将每个部分馈送到这n个进程中的每个进程(基本上是一个映射缩减)。