XML版本控制算法

Chr*_*ris 5 xml versioning algorithm

我正在寻找一种有效的方法来比较和获得两个基于XML的解析树之间的差异.

您认为存储这些差异的最佳方式是什么?我会这样做的:

XML A:

<w:p>
  <w:pPr>
    <w:spacing w:after="1"/>
  </w:pPr>
  <w:r>
    <w:t>World</w:t>
  </w:r>
</w:p>
Run Code Online (Sandbox Code Playgroud)

XML B:

<w:p>
  <w:pPr>
    <w:spacing w:after="1"/>
  </w:pPr>
  <w:r>
    <w:t>ASDF</w:t>
  </w:r>
</w:p>
Run Code Online (Sandbox Code Playgroud)

该算法确定"World"已更改为"ASDF",然后存储:

div: <w:p><w:r><w:t>World</w:t> -> <w:p><w:r><w:t>ASDF</w:t>
Run Code Online (Sandbox Code Playgroud)

这足以涵盖可能发生的所有情况吗?

有人知道这样做的好方法吗?真的很感激任何帮助!

sch*_*der 2

可能会变得更难。看这个例子:

<w:p>
  <w:pPr>
    <w:spacing w:after="1"/>
  </w:pPr>
  <w:r>
    <w:t>World</w:t> <-- Case 1: this changes to <w:t>ASDF</w:t>
    <w:t>World</w:t> <-- Case 2: this changes to <w:t>ASDF</w:t>
  </w:r>
</w:p>
Run Code Online (Sandbox Code Playgroud)

为了能够识别这两种情况,您必须将其中一种存储为

 div: <w:p><w:r><w:t>World</w:t> -> <w:p><w:r><w:t>ASDF</w:t>
Run Code Online (Sandbox Code Playgroud)

另一个作为

 div: <w:p><w:r><w:t>World</w:t><w:t>World</w:t> -> <w:p><w:r><w:t>World</w:t><w:t>ASDF</w:t>
Run Code Online (Sandbox Code Playgroud)

或类似的东西(您可能还想向它们添加“w:p”结束标记以使它们成为有效的 XML 子树)。

一般来说,此类程序可能会变得非常复杂,因此我不建议您创建全新的东西,而是使用一些现有的 diff 算法(即使不解析 XML 结构,大多数算法也足够好)或将其中之一修改为适合您的需求。