是否有命令行工具可以从 pdf 中批量提取图像?

chr*_*lee 20 command-line pdf image-processing batch

我有一个 pdf 目录,是客户以 pdf 格式提供给我的。他们没有图像,但它们在pdf中。

有没有办法使用命令行工具从 pdf 中提取所有图像,同时保留其原始文件名?

我在这里回顾了这个问题:使用图层蒙版从 PDF 中提取图像, 但它适用于单个图像。

Mar*_*rco 28

该方案pdfimages从包poppler-utils可能是你在找什么。从手册页:

Pdfimages 读取 PDF 文件 PDF 文件,扫描一页或多页,并为每个图像写入一个 PPM、PBM 或 JPEG 文件。

在较新版本的 poppler-utils 上,有一个all可以提取为 jpg 或 png的开关:

pdfimages -all input.pdf images/prefix
Run Code Online (Sandbox Code Playgroud)

将在图像文件夹中以prefix-nnn.[png|jpg] 格式输出文件。

  • 与“-all”一起使用:“-p”,它将在图像文件的名称中包含页码。 (2认同)