如何在 Adob​​e Acrobat 中浏览内部 PDF 结构?

23 pdf adobe-acrobat

如何在 Adob​​e Acrobat 9.0 中浏览内部 PDF 结构?我没有找到有这个选项的高级菜单。

Mar*_*rer 27

有多种方法可以浏览 PDF 的内部结构。

Pdfs有点人类可读

除了安全密码,大部分都是人类可读的。如果 PDF 有密码,则所有字符串和流(已经被压缩,不会丢失)将是伪随机垃圾。压缩数据流比比皆是,但其中大部分在您最喜欢的文本编辑器中看起来像这样:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj
Run Code Online (Sandbox Code Playgroud)

警告:空格在很大程度上无关紧要,通常会在可能的情况下删除。我只是把它做得很漂亮,让理解它更容易一些。

<< and >>开始和结束“字典”。字典由键/值对组成。键始终是“名称”:所有名称都以“/”开头。该值可以是任何值,包括另一个名称。

[]开始和结束“数组”。数组几乎可以由任何东西组成。

数字是“数字”。浮点数或其他。

()<>开始和结束“字符串”。<> 字符串被列为十六进制值,() 是 ANSI 字符串。

Pet Peeve:/Names 和(Strings)使用完全不同的逃生系统。咕噜噜

间接引用指向 PDF 中的其他对象:
< objNum > < generationNum-AlwaysZero > R

在上面的示例对象中,内容流位于 PDF 中其他位置的对象 4 中。要找到它,您可以使用编辑器文本搜索“N 0 obj”,其中 N 是您想要的对象编号。
警告:PDF 中有数百个甚至数千个对象。搜索“1 0 obj”会得到很多命中。

鉴于您要求查看内部结构,您可能已经知道这一切。其他想知道同样事情的人可能不会。

警告:不要在文本编辑器中编辑 PDF。所有二进制内容都会被破坏,字节偏移量在 PDF 中非常重要。

Acrobat 插件[s]

Windjack Solutions 有一个名为 PDF CanOpener 的 acrobat 插件(无附属关系)。它很光滑。您将能够以树的形式浏览 PDF 结构,查看(和修改)内容流,等等。

第三方应用

很多。许多人将其构建为学习解析 PDF 的一部分,或作为调试工具。他们很方便。

iText RUPS(iText 的一部分,一个 Java PDF 库,现在在 GitHub 上)

PDF 对象浏览器

PDF 田鼠

  • iText RUPS +1,不完全是友好的 GUI,但可以工作,顺便说一下,目前项目 URL 似乎是 (http://sourceforge.net/projects/itextrups/) (5认同)
  • iText RUPS 已移至此处:https://github.com/itext/rups/ (2认同)

Aff*_*esh 9

O2Solutions 提供与 MS Windows 兼容的实用程序,用于查看 PDF 文档的内部结构。它可免费用于个人和商业用途。

http://www.o2sol.com/pdfxplorer/overview.htm


mar*_*ens 5

您可以使用Browse Internal PDF Structure来自 Preflight 插件的命令在 Adob​​e Acrobat 中浏览内部 PDF 结构:

http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/

您还可以使用Acrobat 的商业PDF CanOpener插件查看对象结构或免费的PDFedit来解码 PDF 中的压缩数据流。


Ale*_*kov 5

PoDoFoBrowser一款小巧的免费便携式实用程序,不仅可以浏览内部 PDF 结构,还可以导出、导入和编辑对象数据。它可以从这里下载:

http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/

这是它在 Windows 下的外观:

截屏


juF*_*uFo 5

PDF Vole 似乎坏了。如果有人仍在寻找工具,我正在使用免费的PDF 分析器

在此输入图像描述