我的问题是我的任务是从 640 页的 PDF 文件中提取图像。
其中大部分是带有文本的图表和表格。进行简单的复制和粘贴会使图像失去分辨率,文本变得模糊,有时甚至无法阅读。
您知道从 PDF 文件中提取图像而不影响分辨率的更好方法吗?
Kur*_*fle 26
从 XPDF 套件(免费和开源软件)中,您可以使用pdfimages.exe
CLI 工具从 PDF 中提取所有图像,或仅从一系列页面中提取所有图像。这是从第 33-36 页中提取所有图像的示例:
pdfimages.exe ^
-f 33 ^
-l 36 ^
-j ^
c:/path/to/input.pdf ^
c:/path/to/directory/input_images
Run Code Online (Sandbox Code Playgroud)
该-j
将尝试提取嵌入式JPEG图像JPEG格式。所有其他图像都输出为 PPM(便携式像素图)。注意,PPM 是完全未压缩的!
否 - 复制和粘贴应保留嵌入资源的原始分辨率 - 最有可能发生的情况是,它是在 PDF 内缩小的低分辨率图片,因此导出时,它看起来比实际情况更糟糕。
尝试缩小它和/或使其大小与 PDF 中的大小相同,它实际上应该是相同的。
或者,(也是最糟糕的选择)转到 100% 缩放并截取屏幕截图或使用 Windows Vista / Windows 7 中的截图工具。
注意 - s 中的图像.PDF
通常在转换为 时会收缩/压缩.PDF
,但是,一旦压缩,您应该能够以与 相同的质量进行提取PDF
,而不是更差。
归档时间: |
|
查看次数: |
98105 次 |
最近记录: |