Google AppEngine 上的 HTML 转 PDF

Tim*_*ens 6 google-app-engine html2pdf python-2.7

我们目前正在尝试使用 Python 在 AppEngine 上将 html 文件转换为 PDF。HTML 文件来自第三方供应商,因此我们无法控制它们的格式。灵活和标准环境都是选项,但我们走的每一条路似乎都遇到了障碍:

  • PDFkit需要安装 wkhtml2pdf,没有可用的 PIP 包,但是可以完美地离线转换
  • xhtml2pdf / PISA - 甚至适用于 GAE 标准,但不支持许多功能,例如浮动和格式错误的 HTML
  • WeasyPrint - 理论上 C 依赖项可以在弹性环境中运行,但没有可用于依赖项的 pip 包,包括 Cairo 和 Pango

有没有人在 AppEngine 上运行过具有上述任何功能的强大解决方案?或者我缺少其他图书馆?

小智 1

一年前,我遇到了同样的问题,并得出结论,目前在 App Engine 中这是不可能的,至少在转换质量良好的情况下是不可能的。(如有变动,请指出)

xhtml2pdf - 我能够在标准 App Engine 中成功运行它,但对转换质量一点也不满意。

PDFkit - 遇到了类似的问题并提出了不同的解决方案。在计算引擎实例上托管 PDFkit 并公开一个端点,其中带有 HTML 文件的 POST 请求将返回转换后的 PDF 作为响应。这在处理质量/速度方面给了我最好/预期的结果。

它确实产生了一些额外费用,但我也可以将该实例用于其他用途;)。我最初选择了尽可能少的配置,因为我没有在 Compute Engine 实例上存储任何内容。