用于将Word文档文本转换为HTML的库

Ram*_*Vel 8 html c# asp.net ms-word

是否有.Net开源库将单词dococument转换为HTML以显示在网页内.

我知道几种将word文档转换为html文件的工具,但我的要求是在ASP.Net应用程序中将文档(从文件或只是提取的文本)转换为HTML.

我发现转换-a-word-document-into-useful-html-in-php PHP库做同样的事情,.net中是否有类似的工具?

Den*_*s G 2

您只想将 *.doc 文件转换为 HTML?是否可以将其另存为 HTML 文件?

标准 .SaveAs方法可以选择另存为 HTML:

wdFormatHTML 使用 HTML 标记保存所有文本和格式,以便可以在 Web 浏览器中查看生成的文档。

来自:MSDN另存为方法

有关如何使用该方法将 .doc 转换为其他格式的示例教程,您可以在此处找到:如何使用 C# 将 DOC 转换为其他格式

如果您有 *.docx 文件而不是 *.doc 文件,那就更容易了,因为您可以使用 OpenXML API,如 MSDN 上所述:使用Open XML 格式 API 操作 Word 2007 文件(第 1 部分,共 3 部分)。如果您获得了 Word 文件的 XML,您当然可以将其输出为您想要的任何格式 (HTML)。