我一直看起来疯狂的解释一个有效的差异算法.
我得到的最接近的是RFC 3284的链接(来自几个Eric Sink博客文章),它以完全可以理解的术语描述了存储diff结果的数据格式.但是,它并没有提到程序如何在进行差异时达到这些结果.
我试图从个人的好奇心来研究这个问题,因为我确信在实现差异算法时必须进行权衡,当你看到差异并且想知道"为什么差异程序选择这个作为一个变化时,这很清楚而不是那个?"......
在哪里可以找到最终输出VCDIFF的高效算法的描述?
顺便说一下,如果您碰巧找到了SourceGear的DiffMerge使用的实际算法的描述,那就更好了.
注意:最长的公共子序列似乎不是VCDIFF使用的算法,考虑到它们使用的数据格式,它们看起来更聪明.