Google App Engine PDF转换器

Kev*_*vin 14 pdf google-app-engine pdf-generation html-to-pdf

我正在寻找一个好的,开源的 PDF生成器/库,它将html(带样式等)转换为PDF文件.

需求:

  • 必须是Java或Python并在Google App Engine上运行.
  • 必须是免费的,开源的.
  • 必须易于使用/消费.

是的,我已经尝试过自己搜索 - 我已经尝试了很多我在Google等上找到的"解决方案".但是还没有让我满意.许多似乎不完整,有缺陷或在GAE上运作不佳.所以我想我会向StackOverflow社区寻求意见或建议.

Bry*_*utt 11

对于HTML /图像到PDF,我使用Python库http://www.xhtml2pdf.com/,它使用在GAE上运行的Pisa,Reportlab,pyPdf和html5lib.我一直在使用它来生成带有嵌入式图像的非常好的文章PDF,一旦我弄清楚如何使页面大小正确,我发现这是一个非常好的库.

您将需要xhtml2pdf库及其依赖项:https: //github.com/chrisglass/xhtml2pdf

我把一些示例Python代码放在​​一起,并把它放在这个pastebin中:http: //pastebin.com/FFEZjNs3

最后得到的pdf_data是二进制PDF文件数据.你给pisa的html_data实际上是包含HTML文档的任何字符串.

HTML中包含一些推荐的内容,可以获得格式良好的PDF输出.这是一个示例HTML文档,类似于我使用的基本模板.请注意作者meta字段和@page CSS:http://pastebin.com/q1wRm9nJ

以下是有关兼容的CSS和HTML的文档:https: //github.com/chrisglass/xhtml2pdf/blob/master/doc/usage.rst#supported-css-properties

您可以使用外部图像的URL包含图像,也可以使用dataUri,xhtml2pdf具有创建这些"pisa.makeDataURI()"的功能.

希望这会有所帮助.