HTML 到 RST 转换器

tic*_*pix 7 html xml restructuredtext scikit-learn

我有很多使用 docutils 转换为 HTML 的 RST(reStructuredText)文件。使用开发的小型 JS 应用程序(具有 HTML5 contenteditable 属性的基本 iframe),非技术人员可以轻松编辑生成的 HTML 页面。目标是将在 HTML 中所做的修改应用回原始 RST 文件。

我想知道是否有一种方法可以使用 original_RST -> output_HTML 转换的基本事实来训练算法,以便我们以后可以将 output_HTML+minor 修改反向回 RST ?会是什么样的算法?我应该从哪个方向开始挖掘?

为了简化问题,我还可以使用 docutils 的内部 XML AST 表示形式而不是 RST 作为文档输入(RST 到 XML-AST:http ://docutils.sourceforge.net/tools/quicktest.py ),然后修复xml2rst+xslt 项目 ( http://www.merten-home.de/FreeSoftware/xml2rst/ )

欢迎任何建议

Ric*_*rez 4

尝试潘多克

如果您需要将文件从一种标记格式转换为另一种标记格式,pandoc 就是您的瑞士军刀。