23 pdf adobe-acrobat
如何在 Adobe Acrobat 9.0 中浏览内部 PDF 结构?我没有找到有这个选项的高级菜单。
Mar*_*rer 27
有多种方法可以浏览 PDF 的内部结构。
除了安全密码,大部分都是人类可读的。如果 PDF 有密码,则所有字符串和流(已经被压缩,不会丢失)将是伪随机垃圾。压缩数据流比比皆是,但其中大部分在您最喜欢的文本编辑器中看起来像这样:
2 0 obj
<< /Type /Page
/MediaBox [0 0 612 792]
/Contents 4 0 R
/Resources << /Fonts
<< /F1 5 0 R>>
>>
>>
endobj
Run Code Online (Sandbox Code Playgroud)
警告:空格在很大程度上无关紧要,通常会在可能的情况下删除。我只是把它做得很漂亮,让理解它更容易一些。
<< and >>开始和结束“字典”。字典由键/值对组成。键始终是“名称”:所有名称都以“/”开头。该值可以是任何值,包括另一个名称。
[和]开始和结束“数组”。数组几乎可以由任何东西组成。
数字是“数字”。浮点数或其他。
()和<>开始和结束“字符串”。<> 字符串被列为十六进制值,() 是 ANSI 字符串。
Pet Peeve:/Names 和(Strings)使用完全不同的逃生系统。咕噜噜
间接引用指向 PDF 中的其他对象:
< objNum > < generationNum-AlwaysZero > R
在上面的示例对象中,内容流位于 PDF 中其他位置的对象 4 中。要找到它,您可以使用编辑器文本搜索“N 0 obj”,其中 N 是您想要的对象编号。
警告:PDF 中有数百个甚至数千个对象。搜索“1 0 obj”会得到很多命中。
鉴于您要求查看内部结构,您可能已经知道这一切。其他想知道同样事情的人可能不会。
警告:不要在文本编辑器中编辑 PDF。所有二进制内容都会被破坏,字节偏移量在 PDF 中非常重要。
Windjack Solutions 有一个名为 PDF CanOpener 的 acrobat 插件(无附属关系)。它很光滑。您将能够以树的形式浏览 PDF 结构,查看(和修改)内容流,等等。
很多。许多人将其构建为学习解析 PDF 的一部分,或作为调试工具。他们很方便。
iText RUPS(iText 的一部分,一个 Java PDF 库,现在在 GitHub 上)
O2Solutions 提供与 MS Windows 兼容的实用程序,用于查看 PDF 文档的内部结构。它可免费用于个人和商业用途。
http://www.o2sol.com/pdfxplorer/overview.htm
您可以使用Browse Internal PDF Structure来自 Preflight 插件的命令在 Adobe Acrobat 中浏览内部 PDF 结构:
http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/
您还可以使用Acrobat 的商业PDF CanOpener插件查看对象结构或免费的PDFedit来解码 PDF 中的压缩数据流。
PoDoFoBrowser是一款小巧的免费便携式实用程序,不仅可以浏览内部 PDF 结构,还可以导出、导入和编辑对象数据。它可以从这里下载:
http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/
这是它在 Windows 下的外观:

| 归档时间: |
|
| 查看次数: |
27464 次 |
| 最近记录: |