如何从原始分辨率和格式中提取pdf文档中的所有图像?(意思是提取tiff为tiff,jpeg为jpeg等,无需重新采样).布局是不重要的,我不在乎是源图像位于页面上.
我正在使用python 2.7,但如果需要可以使用3.x.
在python代码中,如何有效地将pdf中的某个页面保存为jpeg文件?(使用案例:我有一个python flask web服务器,上传pdf-s,每个页面对应的jpeg-s是商店.)
这个解决方案很接近,但问题是它没有将整个页面转换为jpeg.
我正在尝试使用Python将多页PDF转换为一系列JPEG.我可以使用可用的工具轻松地将PDF分割成单独的页面,但我无法找到任何可以将PDF转换为图像的内容.
PIL不起作用,因为它无法读取PDF.我发现的两个选项是通过shell使用GhostScript或ImageMagick.这对我来说不是一个可行的选择,因为这个程序需要跨平台,我不能确定这些程序中是否有任何一个可以安装和使用它们.
有没有可以做到这一点的Python库?
当然有某种抽象可以实现这一点吗?
这基本上就是命令
cmd = self._ghostscriptPath + 'gswin32c -q -dNOPAUSE -dBATCH -sDEVICE=tiffg4
-r196X204 -sPAPERSIZE=a4 -sOutputFile="' + tifDest + " " + pdfSource + '"'
os.popen(cmd)
Run Code Online (Sandbox Code Playgroud)
这种方式看起来真的很脏,必须有一些pythonic方式
python ×4
pdf ×3
image ×2
extract ×1
ghostscript ×1
imagemagick ×1
jpeg ×1
pypdf ×1
windows ×1