标签: pdftextstream

Java - 使用 OCR 从 PDF 中提取文本

我有一个 pdf 文件(下面给出了其中的一部分),并且想从中提取文本。我使用过 PDFTextStream,但它不适用于此文件。(但是它可以与其他具有简单文本的文件一起使用)。

还有哪些其他 OCR 库能够做到这一点?

请帮忙。谢谢。

pdf 文件一览

pdf 文件预览

java pdf text-extraction pdfbox pdftextstream

4
推荐指数
1
解决办法
1万
查看次数

标签 统计

java ×1

pdf ×1

pdfbox ×1

pdftextstream ×1

text-extraction ×1