合理的 HTML 到 PDF 自动转换(在 UNIX/Linux 环境下)

Ale*_*hov 16 linux pdf html

有没有办法在 Linux 中从 HTML 文件自动生成 PDF 文档,其中 PDF 与输入文件具有某种合理的相似度?

命令行工具——而不是某种交互式 GUI——是关键。

htmldoc当然,我试过和一些相关的表亲。但这些工具已经无可救药地处于石器时代; htmldoc根本不支持 CSS。如今,您不会发现很多 HTML 文档至少没有一些CSS 样式。我并不真正关心愚蠢的效果或小装饰,但问题是 CSS 是当今大多数布局的核心;没有多少人在使用 6 层嵌套表了。因此,如果转换工具对 CSS 一窍不通,那不仅仅是“文档看起来不太正确”的问题;它很可能根本不符合可用性的最低标准。

一些人向我建议尝试使用 Gecko 渲染引擎来生成可以转换为 PDF 的图像,但我不知道如何去做,更不用说容易了。

我相信有很好的商业工具可以做到这一点,但如果可能的话,我真的在寻找一个开源包,因为这项工作本身就是一个开源包,而且不花钱。

提前致谢!

rob*_*rtc 7

你见过wkhtmltopdf吗?不能说它个人的效果如何,但它似乎正是您所需要的。唯一的问题可能是,使用此解决方案和任何“浏览器自动化”解决方案,它将选择打印样式表而不是屏幕显示样式表,因此 PDF 可能与您在屏幕上看到的不完全相同。