docx/doc/rtf和轻量级标记之间的转换

Ada*_*deg 5 markup cross-platform ms-word docx

我正在寻找一个工具或一组工具来转换文件格式D和M在哪里

  • D是MSWord按优先顺序处理的格式,docx,doc,rtf
  • M是一个轻量级的标记,如markdown,textile,txt2tags,它可以是一个深奥的标记
  • 有一种方法可以从M生成html
  • 转换是双向的,它既可以从D到M,也可以从M到D完成
  • utf-8编码处理得当
  • 内容很简单,段落,一些简单的格式,如粗体和斜体,也许列表
  • 这些工具与平台无关

到目前为止我发现了什么

  • TeX,LaTeX--太重量级了
  • docx2txt - 太轻了,它根本不支持格式化
  • HTML - MSWord生成臃肿的HTML
  • 一些单向转换,例如doc to mediawiki,

更新:

用例是技术人员和非技术人员之间的文档工作流程

  • 我,技术人员用纯文本编辑文档,将其放入版本控制等.
  • 我把它寄给我的经理或其他非技术人员
  • 他们添加评论,使用他们的Word对其进行更改,然后将其发回给我
  • 我想简单地修改他们的更改,进行更改,将其置于版本控制中,而不必使用Word

Jas*_*ext 0

Adam,我使用 docx4j 将 docx 转换为 html,在 CKEditor 中编辑 html,然后使用 docx4j 将 html 转换回 docx。我的过程对 css 做了一些假设(即它被设计为处理 docx4j 的干净 html,并在 CKEditor 中进行编辑)。

你不说有没有办法从HTML生成M?