删除PDF元数据(删除完整的PDF元数据)

y11*_*y11 10 pdf metadata

我想从 PDF 文件中删除元数据。我已经尝试使用“exiftool”、“pdftk”和“qpdf”来删除元数据(建议的方法 - https://gist.github.com/hubgit/6078384)。这些工具声称可以删除元数据,但不幸的是保留了它们。我使用“grep -ametadata_fieldname file.pdf”选项,我可以检索元数据值。

有没有办法彻底删除PDF文件中的元数据信息(删除所有包含元数据信息的对象)。

我正在使用Ubuntu。当我使用 LaTeX 工具(前 pdfTeX)或 LibreOffice 创建 PDF 文件时,该工具会自动在 PDF 文件的元数据中写入 Producer、Creator 以及有时完整横幅等信息。因此,我希望从 PDF 文件中删除此信息(基本上是 PDF 创建工具存储的元数据信息)。

tee*_*ran 14

要在 ubuntu 终端上使用 pdftk 删除所有 pdf 信息字典,可以使用以下命令:

pdftk file.pdf  dump_data |sed -e 's/\(InfoValue:\)\s.*/\1\ /g' | pdftk file.pdf update_info - output file_no_meta.pdf
Run Code Online (Sandbox Code Playgroud)

假设 file.pdf 是源文件,并且您的 pdf 文件输出为 file_no_meta.pdf

接下来,使用以下命令删除 XMP 元数据:

exiftool -all:all= -overwrite_original file_no_meta.pdf
Run Code Online (Sandbox Code Playgroud)

最后,在终端上使用以下命令再次检查文件元数据:

pdfinfo file_no_meta.pdf
Run Code Online (Sandbox Code Playgroud)

  • 是的,我明白你的意思,在这种情况下,你可以使用 exiftool 删除 XMP 元数据。我刚刚添加了有助于从文件中删除 XMP 元数据的代码。请检查一下并看看。 (2认同)