将pdf,doc,ppt转换为html5

Kev*_*vMo 39 html5 document-conversion scribd

我用Google搜索(没有任何运气)open source software that can convert doc, ppt, and pdf to HTML5.(正是Scribd所做的)Scribd的转换类型是否有开源等价物?

如果有人知道付费服务,那也行.Scribd有一个API,但它适用于flash查看器.此外,我想托管我自己的内容,因为我需要进一步控制转换后的HTML文档.

imo*_*ama 15

您不太可能找到能够完成所有这些工作的单一产品,尤其是在开源世界中.你最终可能会依赖混杂的东西,甚至可能需要链接一些转换器才能获得HTML.(例如PDF - > ps - > HTML)

OpenOffice支持转换为HTML,可以从命令行调用.

http://pdftohtml.sourceforge.net/看起来相当擅长将pdf转换为html.

对于Word ML或OpenXML格式的Doc,可以想象您可以使用XSLT转换,因为输入和输出格式都是XML.我见过一些漂浮在网上的样式表,但YMMV.

顺便说一下,为什么对开源有特定要求?例如,MS Powerpoint已经支持另存为HTML.


Mar*_*sel 5

Open Office会将pdf转换为html,但你会受到设计质量的影响.

我建议:Crocodoc作为付费服务(它为不同的平台提供不同的风格,如Python,Ruby,Java,PHP开发人员可以使用他们的API.)或等待官方的Adobe工具(它正在开发中).

  • Crocodoc现在免费:) (3认同)

PF4*_*lic 1

http://wvware.sourceforge.net/

wvHtml:将您的Word文档转换为HTML4.0。

可能: http: //www.abisource.com/ 但在这种情况下,它看起来像手动“打开文档”>“导出 html”,也许插件有帮助。不确定,你的意思是:“可以转换的源软件”。

或者这个: http: //www.zope.org/Members/sf/NuxDocument

另外,pdftohtml 将为您提供 html 页面输出。但是您必须在其图形界面上工作。因为它似乎不太具有交互性。