从pdf文件中提取矢量图像

v92*_*23z 14 linux pdf command-line image

Linux上是否有一个命令行工具可以从pdf文件中提取数字,并以矢量格式保存它们?我知道pdfimages,但这会创建一个位图,这不是我需要的.

Din*_*ngo 15

不仅仅是图像,因为你似乎需要,但是

  • pdftocairo

http://poppler.freedesktop.org/

http://www.manpagez.com/man/1/pdftocairo/ (手册页)

能够将pdf页面呈现为其他矢量格式,如PS/EPS/SVG

假设您有一个带矢量化图像的pdf页面,您可以将此页面渲染为svg,然后仅复制您感兴趣的图像

注意:pdftocairo无法将多页pdf渲染为多页svg

如果您需要转换为svg几个pdf页面,您首先需要选择此页面范围,然后将pdf页面突发到单个pdf页面

示例(如果我们需要将pdf文件的1-10页转换为svg)

pdftk file.pdf cat 1-10 output 1-10.pdf

pdftk 1-10.pdf burst

for f in *.pdf; do pdftocairo -svg $f; done

最后,使用sodipodi或inkscape,您可以从svg渲染的pdf页面中提取您感兴趣的图像