我有两个可搜索的 PDF 文档,比如说even.pdf和odd.pdf,分别包含一本书的偶数页和奇数页。
我可以将每个 PDF 反编译为单独的文件001.pdf 002.pdf 003.pdf,等等。问题是如何合并它们?
它们都是偶数和奇数序列编号1, 2, 3。如果反编译过程中的编号pdftk不同,例如1, 3, 5对于偶数和2, 4, 6奇数而不是1, 2, 3, 4,我可以简单地合并它们。
我可以用其他方式做到这一点吗?
我有一系列 PDF 文件1.pdf,2.pdf等等,我想将它们合并到一个文件中,所有的 PDF 都平铺在一页上。
目前,我试图pdftk合并这些文件,但它们被放在单独的页面上:
pdftk 1.pdf 2.pdf ... cat output merged.pdf
Run Code Online (Sandbox Code Playgroud)
有没有办法将单个 PDF 文件平铺到一个母版页上merged.pdf?
我需要删除一些在公共领域书籍的所有页面上扩展的愚蠢电子邮件水印。我查看了 pdftk 手册页和一些示例,但仍然无法弄清楚如何删除水印。我很欣赏你的提示。
我有一个已经压缩过的 PDF 和一些人工图像,我正在使用 Ghostscript 为该 PDF 添加一个标题页。
但是,我找不到任何方法告诉 GS 按原样使用现有图像而不重新处理它们,现在我觉得这与 GS 的工作方式有关,即您无法重新编译/链接 PDF没有重新处理它的图像..是真的吗?
我可以在 GS 中提高 DPI 设置,但它会从 5MB 增加到 60MB,同时看起来仍然更糟。
有没有更好的替代 GS 可以满足我的需要(最好是在 OS X 上编译)?
我有一个 pdf 文件,每页都有一些我想删除的文本。
文本与正则表达式匹配,我认为它位于 pdf 的一个块中。
我已经使用 pdfedit 通过 GUI 选择和删除文本,但我正在寻找一种从终端执行此操作的方法。
我想使用 pdftk 从一个大(600 多页)文档中抓取几页。我怎样才能做到这一点?
例如:假设我需要的页面是名为“bloated.pdf”的文件中的 300、307-310 和 315-318。这似乎不起作用:
pdftk A=bloated.pdf cat A300,307-310,315-318 output slim.pdf
Run Code Online (Sandbox Code Playgroud) 我有很多 PDF 文件,每个文件有 1 到 4 页。我需要一个能够为每个文件自动生成一个新文件的解决方案。新文件应该两次包含原始文件的内容(即第 1 页到最后,然后是相同顺序的相同页面)。
我该如何实现?
我有两个页数相同的 pdf 文件,并希望将每个页面与另一个文件中的相应页面进行比较。为此,我想将 File1.pdf 的第 1 页与 File2.pdf 的第 1 页合并,以便在新文档中获得一页。然后将 File1.pdf 的第 2 页与 File2.pdf 的第 2 页设为新文件的第 2 页。
在这个问题中,我已经了解到我可以使用--nup以下pdfjam命令将两页放在一页上:
pdfjam File1.pdf File2.pdf --nup 2x1 --landscape --outfile File1+2.pdf
Run Code Online (Sandbox Code Playgroud)
使用ImageMagick包可以实现相同的目的:
montage *.pdf merged.pdf
Run Code Online (Sandbox Code Playgroud)
但这将第一个文件的第 1 页和第 2 页放在一起,稍后对第二个文件执行相同的操作 - 不是预期的。
我所做的是拆分两个文件。第一个文件的文件名是偶数,第二个是奇数(实际上我用适当的文件名重新创建了文件)。然后我再次合并所有文件
pdftk *.pdf cat output merged.pdf
Run Code Online (Sandbox Code Playgroud)
最后把两页放在一张纸上
pdfjam --nup 2x1 --landscape --outfile merged2up.pdf merged.pdf
Run Code Online (Sandbox Code Playgroud)
我可以编写一个带有循环的脚本,但我想知道是否有一个简单的单线来实现这一点?也许我没有找到正确的 pdfjam、pdftk 或 ImageMagick 命令?
我正在使用 pdftk 对 PDF 执行一些操作。现在我是这样做的:
pdftk <files> OPERATION <options> output - | \
pdftk - <other files> OPERATION <options> output - | \
...
pdftk - OPERATION <options> output final.pdf
Run Code Online (Sandbox Code Playgroud)
所以基本上我将第一个操作的结果输出到stdout,然后将它输送到另一个 pdftk 进程,依此类推,直到我完成。
有没有更好的方法只用一个 pdftk 进程来做到这一点?
使用的操作有:cat,multistamp,shuffle和范围在页面上选择。
pdftk ×10
pdf ×9
linux ×2
batch ×1
command-line ×1
duplicate ×1
ghostscript ×1
imagemagick ×1
merge ×1
pdfedit ×1
watermark ×1