根据PDF 1.7 规范,第 90 页,第 3.4 节:
前面的部分描述了单个对象的语法。本节介绍如何在 PDF 文件中组织对象以实现高效的随机访问和增量更新。规范的 PDF 文件最初由四个元素组成(见图 3.2):
标识文件符合的 PDF 规范版本的单行标题
包含构成文件中包含的文档的对象的主体
包含有关文件中间接对象信息的交叉引用表
提供交叉引用表的位置和文件正文中某些特殊对象的位置的预告片
基本上,该结构具有标题,然后是正文内容,然后是交叉引用表,最后是给出外部参照表位置的尾部。这里的关键部分是trailer和xref表位于文件的末尾,该xref表包含正文内容的相关元数据(主要是 10 位字节偏移量)。
鉴于外部参照表本身位于PDF 文件的最末尾:
查看我部分下载的 PDF 文件的屏幕截图:
