PaddleOCR 性能与 Tesseract 相比如何?

use*_*206 9 paddle-paddle

我最近遇到了 PaddleOCR,我想知道这个 OCR 系统与 Tesseract 相比如何。有可用的数据或基准吗?

Esr*_*oud 9

我在一些研究中使用这两种方法已经快一年了。我可以说,每种都有其完美的用途。

PaddleOCR 专业版:

  1. 如果文本以非 90 度旋转,PaddleOCR 仍然可以正确检测某些文本,但即使使用 OSD,Tesseract 也无法做到这一点。
  2. 您可以使用检测结果来修复旋转,但 Tesseract 很可能会检索到无意义的结果。
  3. 如果您无法对图像进行二值化,则当图像为RGB/BGR时,PaddleOCR 的效果比 Tesseract 更好。

Tesseract PRO:

  1. 即使在操作参数后,PaddleOCR 在检测空格方面也存在严重问题,但他们正在努力在下次升级中修复此问题。Tesseract 不存在严重的空间问题。
  2. Tesseract 在处理扫描文档方面更好。
  3. 图像分割模式可以发挥作用,对改善结果有很大帮助。
  4. 具有长文本的二值化图像的 Tesseract 结果通常比 PaddleOCR 更好。
  5. Tesseract 在检测符号方面要好得多。
  6. Tesseract在 CPU 上速度更快

简而言之,使用 Tesseract 非常适合扫描文档,而 PaddleOCR 则适合一般计算机视觉项目


小智 5

我发现了PaddleOCR 2 和 Tesseract 4之间的比较,但仅限于英文文本。简单总结一下:

  1. PaddleOCR 在 CPU 上比 Tesseract 稍慢,但在 GPU 支持下,它在标准 GPU 上比 Tesseract 快 46%。
  2. 如果没有进行后处理,PaddleOCR 的错误主要是缺少单词和标点符号之间的空格。然而,这些错误很容易纠正。后处理后的精度与 Tesseract 相当(低 1%)。
  3. 英语预训练模型的文件大小仅为 Tesseracts 英语训练数据的 10%(2MB vs 23MB)。

对于目前 PaddleOCR 的主要优先考虑的中文文本,情况可能有所不同。