好吧,我最近问了一个关于将PDF文件变成XML文件,然后将其返回到PDF文件的问题,最好与原文完全相同,但至少差不多.
我一直在尝试不同的方法,到目前为止我想出了这个方法.
- 用LibreOffice编写的文档保存为DocBook XML.说它名为"file.xml".
- 使用文件"docbook.xsl"启动的DocBook项目中的一组XSL模板解析此文件.
- 这可以通过运行:xsltproc -o intermediate-fo-file.fo /usr/share/xml/docbook/stylesheet/nwalsh/fo/docbook.xsl file.xml来完成
- 结果是一个中间的XSL-FO,它通过运行成为PDF:fop intermediate-fo-file.fo final.pdf
- 此PDF文件看起来与原始ODT文件几乎相同.
但是,我说开头有一个PDF文件,怎么可能做同样的事情?有什么建议?