Soj*_*tsu 5 xml xslt xpath docx openxml
我有一个关于将 Word DOCX XML (OOXML) 文件转换为 HTML 格式的项目。
我使用 XML Spy 和 XSLT、XPath、XML 进行此转换。
想象一下我用 XSLT 编写程序并转换它的单个 Word 文件。但是我的主管说,如果我更改文件中的值,该方法将不起作用。
我同意这一点,因为我只为该文档指定了代码,因为我知道其中包含的内容。
但是,我们如何在 XSLT 中编写通用代码来将所有 Word 文件转换为格式良好的 HTML 文档(因为 Word 文档可能彼此有很大不同)?
问题是我想用 XSLT 来做吗?这里有什么不对吗?或者我只是对此太混乱了。
您使用 XSLT 将 DOCX 文件转换为 HTML 的计划从根本上是合理的。XSLT 非常适合此目的,因为它非常适合从 XML 映射到 XML(或 (X)HTML)。
您面临的挑战是基于 DOCX 的 XML 很复杂。 Ecma Office Open XML 第 1 部分 - 基础知识和标记语言参考就超过 5K 页。如果您非常了解 XML、XML 名称空间、XSLT、HTML 和 CSS,那么您“只需”学习 OOXML 的一些基础知识即可开始。
如果您从根本上理解 OOXML,那么您不必担心更改值。从段落中文本运行的概念开始:w:t,w:r和w:p。
Eric White撰写了大量关于 OOXML 的文章,甚至专门将其转换为 HTML。有关优秀文章和示例,请参阅将 Open XML WordprocessingML 转换为 XHtml。
| 归档时间: |
|
| 查看次数: |
3612 次 |
| 最近记录: |