如何使 ghostscript 不擦除 PDF 元数据

Mar*_*rco 11 pdf ghostscript

Ghostscript 会擦除 PDF 元数据等author, title, subject。我如何告诉 ghostscript 不要触摸元数据?我调用它如下:

gs \
  -dBATCH                    \
  -dNOPAUSE                  \
  -sOutputFile=<output_file> \
  -sDEVICE=pdfwrite          \
  -dPDFSETTINGS=/ebook       \
  <input_file>
Run Code Online (Sandbox Code Playgroud)

Mar*_*rco 6

显然,使用 ghostscript 时不可能保留 PDF 元数据。这是一种解决方法,首先使用 将元数据保存到文件中pdftk,然后使用压缩文件,ghostscript 最后也使用 回写元数据pdftk

INPUTPDF=<input_file>
OUTPUTPDF=<output_file>
TMPPDF=$(mktemp)
METADATA=$(mktemp)

# save metadata
pdftk "$INPUTPDF" dump_data_utf8 > "$METADATA"

# compress
gs                       \
  -q                     \
  -sOutputFile="$TMPPDF" \
  -sDEVICE=pdfwrite      \
  -dNOPAUSE              \
  -dBATCH                \
  -dPDFSETTINGS=/ebook   \
  "$INPUTPDF"

# restore metadata
pdftk "$TMPPDF" update_info_utf8 "$METADATA" output "$OUTPUTPDF"

# clean up
rm -f "$TMPPDF" "$METADATA"
Run Code Online (Sandbox Code Playgroud)

编辑:这是 ghostscript 中的一个错误,请参阅错误报告确认这不应该发生