如何使用Java将HTML网页转换为PDF文件

jak*_*ake 4 java pdf

我一直在互联网上搜索如何使用Java将HTML页面转换为PDF文件。我发现了很多指针,总之,它们不起作用或太难实现。我还下载了商业产品pdf4ml;API是我很乐意使用的东西,除了当我在Wikipedia上爬一个简单的页面时,遇到内存不足错误(将Xmx设置为1024 M)。在某些方法中,他们建议转换HTML-> XHTML-> FO-> PDF。但是,我从XHTML到FO XLS文件有很多例外;并阅读文档,这不是我现在没有足够的时间来理解的内容。

这是我的问题/疑虑。1.是否有另一个内聚的API可以轻松地将HTML转换为PDF(商业化与否)?2.有没有一种方法可以让我简单地捕获HTML页面并将其存储为单个文件。这种方法类似于使用Internet Explorer将网页另存为Web存档(单个文件,MHT格式)的方法吗?

任何帮助表示赞赏。(顺便说一句,我知道这个问题已经被反复问过,但是除了问题的初衷之外,我还接受了其他方式)。谢谢。

Tho*_*ler 5

尝试使用WebKit的wkhtmltopdf。另一个选择(我目前正在使用)是使用OpenOffice(通过宏进行远程控制)。