用于以编程方式将HTML页面转换为Image/PDF的最佳Java lib

emp*_*e29 3 java html-to-pdf flying-saucer html-to-jpeg

我正在寻找最好的Java库,我可以在URL中传递它,并让它创建一个网页在浏览器中的样子.我尝试了flyingsaucer, 但似乎几乎每个网页都打破了它 - 它甚至不会渲染www.google.com或yahoo.com - 唯一可以让它呈现的网站是www.w3c.org!

关于更好的工具使用,或者可能允许飞碟在xhtml中更宽松的想法是否接受?

oll*_*llo 5

Flying Saucer在许多页面上失败,因为它只允许xhtml(参见手册).

但是你可以使用一些html库来"清理"你的输入然后使用FS.

Webesite - >"Cleaner" - > Flying Saucer

一些好的和免费的库是:

  1. JSoup(个人推荐)
  2. HtmlCleaner
  3. JTidy(有时比需要更严格)
  4. 杰里科HTML