能否从 PDF 中提取文本并出现“无效外部参照条目”错误?

Kni*_*fNi 5 pdf

我有一个 PDF,我\xe2\x80\x99m 试图阅读,但无法在 Adob​​e Reader 中打开\xe2\x80\x99。使用 pdftotext 时,我看到它说 \xe2\x80\x9cInvalid XRef Entry.\xe2\x80\x9d PDFtk 和 Ghostscript Haven\xe2\x80\x99t 能够解析该文件。我尝试手动修复它,但很快意识到这超出了我的能力范围。

\n\n

我想知道是否有 \xe2\x80\x99s 任何方法可以从文件中恢复任何文本?我可以看到很多图像资源,但没有任何文字清晰可见。有谁知道是否可以恢复?

\n

Max*_*yss 0

在 PDF 中手动乱七八糟肯定会失败(除非您真的知道自己在做什么以及如何做)。

\n\n

如果当前版本的 Acrobat (Reader) 无法解决该问题,您可以尝试使用 Acrobat/Reader 7 或更早版本;较旧的 Acrobat/Reader 版本比新版本尝试更多地修复混乱的文档。

\n\n

否则\xe2\x80\xa6 修复它的机会很小。

\n