我的任务非常简单:将pdf文件的每一页转换为图像.我尝试使用icepdf开源版本来生成图像,但它们不会生成具有正确字体的图像.所以我开始使用PDFBox.代码如下:
PDDocument document = PDDocument.load(new File("testing.pdf"));
List<PDPage> pages = document.getDocumentCatalog().getAllPages();
for (int i = 0; i < pages.size(); i++) {
PDPage singlePage = pages.get(i);
BufferedImage buffImage = convertToImage(singlePage, 8, 12);
ImageIO.write(buffImage, "png", new File(PdfUtil.DATA_OUTPUT_DIR+(count++)+".png"));
}
Run Code Online (Sandbox Code Playgroud)
字体看起来不错,但pdf文件中的图片看起来很晕眩(参见附件).我查看源代码,但我仍然不知道如何解决它.你们知道发生了什么事吗?请帮忙.谢谢!!
我正在寻找生成pdf文件的jpeg缩略图的方法.我想在Python中做到这一点.有没有图书馆或任何人可以指导我怎么做?
谢谢
我正在研究MacOS X Lion.但我想在Ubuntu或CentOS上运行它.
我想知道是否可以将 PDF 转换为没有字体的图像。我的目标是只有没有文字的图像?
如果是,我可以用 ImageMagick/GhostScript 来做吗?
这里有一个例子
图片最终http://crocodoc_public.s3.amazonaws.com/8b8aa154-45e3-41f9-a465-628e1b2e955d/images/page-001.png
和原始 PDF http://crocodoc.com/demo/efwpa(第 2 页)我们可以看到文本覆盖在图像上,我想要做同样的事情。