在 CLI 中获取 PDF 文件的“创建”时间戳

Jos*_*eph 4 command-line pdf

我想知道是否有一个 CLI 命令可以从 CLI 中的“文档”选项卡(来自 PDF 的文件属性)获取“已创建”时间戳?

我知道我可以用来stat从文件系统获取访问/修改/更改的信息,但是由于“文档”选项卡中的元数据嵌入在文件本身中,我不确定如何通过命令行界面。

我需要这样做的原因是为大约 22,000 个 PDF 文件创建一个文件名列表以及“创建”时间戳。显然,这比 GUI 更适合 CLI。

Jam*_*dge 5

如果安装该poppler-utils软件包,则可以使用该pdfinfo命令来执行此操作。例如:

$ pdfinfo OBEX-1.3.pdf 
Title:          Microsoft Word - OBEX13.doc
Author:         Daphne
Creator:        PScript5.dll Version 5.2
Producer:       Acrobat Distiller 5.0.5 (Windows)
CreationDate:   Wed Feb  5 11:12:32 2003
ModDate:        Wed Feb  5 11:12:32 2003
Tagged:         no
Pages:          95
Encrypted:      no
Page size:      612 x 792 pts (letter)
File size:      545666 bytes
Optimized:      yes
PDF version:    1.3
Run Code Online (Sandbox Code Playgroud)

您应该能够使用sed或 等标准工具从此输出中提取创建日期awk

如果您想要更具编程性的东西,您可以poppler直接使用该库。有许多流行语言的绑定,包括 Python(通过python-poppler包)。