PDF 文件的元数据在哪里?我可以将元数据插入任何 PDF 文件吗?

Jaa*_*rre 6 linux software-rec pdf tagging file-metadata

我有很多音乐文件;使用 mp3Tag 程序,我已经组织了所有这些。我有正确的元数据,因为它允许。我正在寻找一个免费软件,它具有相同的功能,但适用于 PDF 文件。

Kur*_*fle 10

Ghostscript 可以在任何 PDF 中插入或修改文档元数据。

注意事项:这样做时,Ghostscript 将 (1) 首先读入完整的 PDF 代码,(2) 第二次重新处理完整的 PDF 代码,(3) 写出一个全新的 PDF 文件。这个过程可能是需要的(可能是为了 PDF 质量的优势,例如通过额外嵌入以前丢失的字体)或不需要的......

怎么做

  1. 创建一个名为mydocinfo.pdfmark的文本文件,并将以下内容放入其中:

    [ /Title (Jaziel 的重要文件)
      /作者 (Jaziel Aguirre)
      /Subject(Aguirre 先生的 pdfmark 实验)
      /Creator(JA 的元数据插入器)
      /ModDate (D:19700101000000+01'00')
      /Producer(Ghostscript 的“pdfmark”技巧)
      /关键字(元数据、Ghostscript、PDF、Linux)
      /CreationDate (D:20181229104653+01'00')
      /文档信息
    pdf标记
    

    请注意,该开放[确实不是需要关闭]-它是由“pdfmark运算”关键字关闭。

  2. 现在运行这个 Ghostscript 命令将新的元数据插入到现有的 PDF 中:

    gs\
      -o with-metadata.pdf \
      -sDEVICE=pdfwrite \
      现有.pdf \
      mydocinfo.pdfmark
    
  3. 检查新的元数据:

    pdfinfo with-metadata.pdf
    
      标题:雅齐尔的重要文件
      主题:Aguirre 先生对 pdfmark 的实验
      关键词:元数据、Ghostscript、PDF、Linux
      添加一名作者
      创建者:JA 的元数据插入器
      制作人:Ghostscript 的“pdfmark”技巧
      创建日期: 2018 年 12 月 29 日星期六 10:46:53 CET
      修改日期:1970 年 1 月 1 日星期四 00:00:00 CET
      标记: 没有
      用户属性:否
      嫌疑人:没有
      形式:无
      JavaScript:没有
      页数:1
      加密:否
      页面大小:142.8 x 202.08 pts
      页面腐烂:0
      文件大小:5394 字节
      优化:无
      PDF 版本:1.7
    

(使用 Ghostscript v9.27 测试。)


GAD*_*D3R 7

pdftk是一个命令行实用程序,允许您使用dump_dataupdate_info选项提取和修改 PDF 元数据。

以下命令将提取input.pdftometadata文件的元数据:

pdftk input.pdf dump_data output metadata
Run Code Online (Sandbox Code Playgroud)

metadata使用文本编辑器修改文件内容,然后将 pdf 文件更新为新的output.pdf

pdftk input.pdf update_info metadata output output.pdf
Run Code Online (Sandbox Code Playgroud)

要检查新的 pdf 文件(打印到标准输出):

pdftk output.pdf dump_data
Run Code Online (Sandbox Code Playgroud)