到目前为止,使用pdfimages和mupdf/进行的图像提取mutool效果还不错。
pdfimages
mupdf
mutool
用FreePDF生成的PDF中的图像始终被切片,因此一张图像会生成多个图像文件。
有避免这种情况的技巧吗?如何使用的结果pdfshow?将PDF转换为PNG或JPEG后,是否有坐标可知道要剪切/裁剪图像的位置,高度和宽度?
pdfshow
pdf image ghostscript xpdf mupdf
ghostscript ×1
image ×1
mupdf ×1
pdf ×1
xpdf ×1