如何使用pdftk从pdf中去除水印?

hnn*_*nns 35 pdf watermark pdftk

我需要删除一些在公共领域书籍的所有页面上扩展的愚蠢电子邮件水印。我查看了 pdftk 手册页和一些示例,但仍然无法弄清楚如何删除水印。我很欣赏你的提示。

小智 61

只是 Dingo 的答案的一点补充,因为它对我不起作用:

我必须先解压缩 PDF 文档才能找到水印并将其替换为sed. 第一步涉及使用pdftk以下方法解压缩 PDF 文档:

pdftk original.pdf output uncompressed.pdf uncompress 
Run Code Online (Sandbox Code Playgroud)

现在,uncompressed.pdf可以在 Dingo 的回答中使用:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf
Run Code Online (Sandbox Code Playgroud)

然后我修复并重新压缩了文档:

pdftk unwatermarked.pdf output fixed.pdf compress
Run Code Online (Sandbox Code Playgroud)

  • 我采用了这个过程,让它变得更漂亮,然后将它封装在一个 Python 脚本中。它在 github [here](https://github.com/agarden/remove-pdf-watermark/tree/master) 上。 (4认同)
  • 无法删除 Master PDF Editor 添加的水印。 (2认同)

Din*_*ngo 37

执行非常简单的任务:

使用 sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf
Run Code Online (Sandbox Code Playgroud)

但是,之后,一定要修复结果输出pdf

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf
Run Code Online (Sandbox Code Playgroud)

全部合并为一个命令:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf
Run Code Online (Sandbox Code Playgroud)

文本水印只不过是 pdf 压缩代码中两个标签之间的文本