TeX*_*ter 4 pdf command-line duplicates ghostscript
使用命令行 Ghostscript,是否可以删除 PDF 中重复的嵌入对象(图像)并将其替换为单个实例?
我有一个 200 多页的 PDF,每页上都有背景图像和一些较小的徽标。该文件非常大,因为完全相同的背景图像和徽标二进制文件嵌入在每个单独的页面中,而不是嵌入一次然后在每个页面上引用。我不是 PDF 的创建者,所以我无法从源头上解决问题。
(我不想缩小或降低图像质量,也不想完全删除它们。)
作为 Ghostscript 的补充,它pdfsizeopt在消除 PDF 中重复的嵌入对象(包括背景图像)方面做得非常好,并且可以在 GhostScript 处理文件之前或之后额外运行。然而,由于它的依赖关系,将其包含在工作流程中有点棘手,并且会创建大量临时文件。可以在https://github.com/pts/pdfsizeopt(以前的https://code.google.com/p/pdfsizeopt/)找到
我的 200 多页文档仅通过删除重复图像就从 150MB 增加到 40MB。