min*_*nty 42
以下是Adobe参考资料的链接
http://www.adobe.com/devnet/pdf/pdf_reference.html
您应该知道PDF只是关于演示,而不是结构.解析并不容易.
dan*_*nio 24
当我第一次使用PDF时,我发现PDF参考很难导航.它可能会帮助您了解文件结构的概述在语法中找到,Adobe称文档结构是对象结构而不是文件结构.这也可以在Syntax中找到.附录A中隐藏了运算符的描述 - 对于理解内容流中发生的事情非常有用.如果您有使用色彩空间的痛苦,您会发现隐藏在图形中!希望这些指针可以帮助您比我更快地找到事情.
如果您正在使用Windows,pdftron CosEdit允许您浏览对象结构以了解它.有一个免费的演示版本,允许您检查文件但不保存它.
这可能会有所帮助:(来自PDF32000.book的第11页)
通过将PDF语法视为四个部分,可以最好地理解PDF语法,如图1所示:
•物体.PDF文档是由一小组基本类型的数据对象组成的数据结构.子条款7.2"词汇约定"描述了用于编写对象和其他语法元素的字符集.子句7.3"对象"描述了对象的语法和基本属性.第7.3.8节"流对象"提供了最复杂数据类型(流对象)的完整细节.
•文件结构.PDF文件结构确定对象在PDF文件中的存储方式,访问方式以及更新方式.该结构独立于对象的语义.第7.5节"文件结构"描述了文件结构.第7.6节"加密"描述了用于保护文档内容免受未授权访问的文件级机制.
•文件结构.PDF文档结构指定了如何使用基本对象类型来表示PDF文档的组件:页面,字体,注释等.第7.7款"文件结构"描述了整个文件结构; 后面的子句解决了组件的详细语义.
•内容流.PDF内容流包含描述页面或其他图形实体的外观的一系列指令.这些指令虽然也表示为对象,但在概念上与表示文档结构的对象不同,并且分别描述.第7.8节"内容流和资源"讨论了PDF内容流及其相关资源.
看起来导航PDF文件需要的不仅仅是传递努力.