pdfimages 不会提取所有图像

Vic*_*oni 5 pdf images pdftk

我正在使用 pdfimages 从PDF 文件中提取图像。我数了最后 10 张图像。但程序只会提取 4。

pdfimages -all file.pdf i
Run Code Online (Sandbox Code Playgroud)

生成

-rw-rw-r--    1 victor victor   61389 Jul 14 21:48 i-000.png
-rw-rw-r--    1 victor victor      88 Jul 14 21:48 i-001.png
-rw-rw-r--    1 victor victor    5226 Jul 14 21:48 i-002.png
-rw-rw-r--    1 victor victor   95657 Jul 14 21:48 i-003.png
Run Code Online (Sandbox Code Playgroud)

我错过了一些设置吗?

如何提取所有图像?

小智 5

Pdfimages 仅支持光栅图像。您在 PDF 中看到的很可能是矢量图形。

我认为没有办法自动提取它们,但您可以使用InkscapeLibreOffice Draw等工具手动获取此类图形。两者的过程是相同的:

  1. 打开 PDF
  2. 选择图形的区域
  3. 复制到剪贴板(Ctrl + C)
  4. 获取新文档(Ctrl + N)
  5. 粘贴(Ctrl + V)
  6. 移至左上角并调整页面大小(Inkscape 可以自动执行这两项操作:Ctrl+Shift+R)
  7. 绘图:导出/Inkscape:另存为 (Ctrl+Shift+S)