如何将HTML文件转换为单词?

Mas*_*ask 35 html ms-word

我有一个要求,我需要将HTML文档保存在内存中作为Word .DOC文件.

任何人都可以给我一些关于封闭和开源库的链接,我可以用来做这个吗?

此外,我应编辑此问题以添加我正在使用的语言,以缩小选择范围.

谢谢!

Jan*_*Jan 31

尝试使用 pandoc

pandoc -f html -t docx -o output.docx input.html
Run Code Online (Sandbox Code Playgroud)

如果未明确指定输入或输出格式,pandoc将尝试从输入和输出文件名的扩展名中猜出它.
- pandoc手册

所以你甚至可以使用

pandoc -o output.docx input.html
Run Code Online (Sandbox Code Playgroud)


小智 5

一个不错的选择是使用像Docverter这样的 API 。Docverter 将允许您使用 API 将 HTML 转换为 PDF 或 DOCX。

  • 你忘记完成你的回答了吗? (13认同)
  • 即使答案尚未完成,imo Docverter 仍然被证明是此页面中最有用的见解:) (3认同)

SAR*_*SAR 5

刚过你的php页面.在此之前的任何代码应该是顶级代码.

<?php
header("Content-Type: application/vnd.ms-word"); 
header("Expires: 0"); 
header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); 
header("content-disposition: attachment;filename=Hawala.doc");

?>
Run Code Online (Sandbox Code Playgroud)

这会将所有html转换为MSWORD,现在您可以根据客户要求自定义它.

  • 虽然不限于PHP。Word很乐意在doc文件而不是docx文件中打开HTML内容。希望我在花时间尝试以各种方式进行实际转换之前就已经知道这一点。 (2认同)

sle*_*ath 1

将文件重命名为 .doc 的其他替代方案......

http://msdn.microsoft.com/en-us/library/microsoft.office.interop.word(office.11​​).aspx

这是一个很好的起点。您还可以尝试使用此 Office Open XML。

http://www.ecma-international.org/publications/standards/Ecma-376.htm