Ghostscript 会擦除 PDF 元数据等author, title, subject
。我如何告诉 ghostscript 不要触摸元数据?我调用它如下:
gs \
-dBATCH \
-dNOPAUSE \
-sOutputFile=<output_file> \
-sDEVICE=pdfwrite \
-dPDFSETTINGS=/ebook \
<input_file>
Run Code Online (Sandbox Code Playgroud)
显然,使用 ghostscript 时不可能保留 PDF 元数据。这是一种解决方法,首先使用 将元数据保存到文件中pdftk
,然后使用压缩文件,ghostscript
最后也使用 回写元数据pdftk
。
INPUTPDF=<input_file>
OUTPUTPDF=<output_file>
TMPPDF=$(mktemp)
METADATA=$(mktemp)
# save metadata
pdftk "$INPUTPDF" dump_data_utf8 > "$METADATA"
# compress
gs \
-q \
-sOutputFile="$TMPPDF" \
-sDEVICE=pdfwrite \
-dNOPAUSE \
-dBATCH \
-dPDFSETTINGS=/ebook \
"$INPUTPDF"
# restore metadata
pdftk "$TMPPDF" update_info_utf8 "$METADATA" output "$OUTPUTPDF"
# clean up
rm -f "$TMPPDF" "$METADATA"
Run Code Online (Sandbox Code Playgroud)
编辑:这是 ghostscript 中的一个错误,请参阅错误报告和确认这不应该发生。