我想知道是否有一个 CLI 命令可以从 CLI 中的“文档”选项卡(来自 PDF 的文件属性)获取“已创建”时间戳?
我知道我可以用来stat从文件系统获取访问/修改/更改的信息,但是由于“文档”选项卡中的元数据嵌入在文件本身中,我不确定如何通过命令行界面。
我需要这样做的原因是为大约 22,000 个 PDF 文件创建一个文件名列表以及“创建”时间戳。显然,这比 GUI 更适合 CLI。
如果安装该poppler-utils软件包,则可以使用该pdfinfo命令来执行此操作。例如:
$ pdfinfo OBEX-1.3.pdf
Title: Microsoft Word - OBEX13.doc
Author: Daphne
Creator: PScript5.dll Version 5.2
Producer: Acrobat Distiller 5.0.5 (Windows)
CreationDate: Wed Feb 5 11:12:32 2003
ModDate: Wed Feb 5 11:12:32 2003
Tagged: no
Pages: 95
Encrypted: no
Page size: 612 x 792 pts (letter)
File size: 545666 bytes
Optimized: yes
PDF version: 1.3
Run Code Online (Sandbox Code Playgroud)
您应该能够使用sed或 等标准工具从此输出中提取创建日期awk。
如果您想要更具编程性的东西,您可以poppler直接使用该库。有许多流行语言的绑定,包括 Python(通过python-poppler包)。