好吧,我最近问了一个关于将PDF文件变成XML文件,然后将其返回到PDF文件的问题,最好与原文完全相同,但至少差不多.
我一直在尝试不同的方法,到目前为止我想出了这个方法.
但是,我说开头有一个PDF文件,怎么可能做同样的事情?有什么建议?
从PDF到XML的无损转换的唯一机会是使用目标XML词汇表,其具有与PDF相同的文档视图.由于PDF的文档视图主要集中在演示文稿上,而像Docbook这样设计XML词汇表的通常动机是捕获更高级别的抽象,因此您面临两个难点:(1)面向表示的XML词汇表不厚在实地,(2)如果你想从PDF转到更传统的XML词汇表(直接或通过面向表示的XML)你将推动水上坡,试图解释文档的表达方式目标词汇的高级抽象.充其量只能使这种过程自动化.
如果这是一种思想实验,并且您正在考虑PDF-XML-PDF往返,以了解何时以及如何可能,那么您现在知道一些人会相信它不可能以任何一般形式给出的原因.如果您出于某些实际原因需要此PDF到PDF数据流,您可能想要反思您是否可以通过其他方式实现您的实际目标.
| 归档时间: |
|
| 查看次数: |
12429 次 |
| 最近记录: |