在不影响分辨率的情况下提取 PDF 中的图像?

r2b*_*2b2 32 pdf images

我的问题是我的任务是从 640 页的 PDF 文件中提取图像。

其中大部分是带有文本的图表和表格。进行简单的复制和粘贴会使图像失去分辨率,文本变得模糊,有时甚至无法阅读。

您知道从 PDF 文件中提取图像而不影响分辨率的更好方法吗?

Kur*_*fle 26

从 XPDF 套件(免费和开源软件)中,您可以使用pdfimages.exeCLI 工具从 PDF 中提取所有图像,或仅从一系列页面中提取所有图像。这是从第 33-36 页中提取所有图像的示例:

pdfimages.exe ^
  -f 33 ^
  -l 36 ^
  -j ^
   c:/path/to/input.pdf ^
   c:/path/to/directory/input_images
Run Code Online (Sandbox Code Playgroud)

-j将尝试提取嵌入式JPEG图像JPEG格式。所有其他图像都输出为 PPM(便携式像素图)。注意,PPM 是完全未压缩的!


小智 5

evince在 Ubuntu 中使用(文档查看器)非常容易。只需使用打开pdf,evince然后取消最大化窗口,标记它,Always on top然后图像拖放到您喜欢的文件夹中。


Wil*_*sum 0

否 - 复制和粘贴应保留嵌入资源的原始分辨率 - 最有可能发生的情况是,它是在 PDF 内缩小的低分辨率图片,因此导出时,它看起来比实际情况更糟糕。

尝试缩小它和/或使其大小与 PDF 中的大小相同,它实际上应该是相同的。

或者,(也是最糟糕的选择)转到 100% 缩放并截取屏幕截图或使用 Windows Vista / Windows 7 中的截图工具。

注意 - s 中的图像.PDF通常在转换为 时会收缩/压缩.PDF,但是,一旦压缩,您应该能够以与 相同的质量进行提取PDF,而不是更差。