什么是最好的(基于单词或字符)的差异算法呢?

Nul*_*uli 8 ruby string algorithm diff merge

所以,我希望能够在每个单词的基础上找到两个字符串之间的差异(可能比每个字符更快,但是,如果每个字符更快,那么我想这样做).

这是我想要实现的一个例子:源文本:

Hello there!
Run Code Online (Sandbox Code Playgroud)

修改文字:

Helay scere?
Run Code Online (Sandbox Code Playgroud)

DIFF:

Hel[lo](ay) [th](sc)ere[!](?)
Run Code Online (Sandbox Code Playgroud)
  • 括号内的文本是删除的内容,括号内的文本是添加的内容

有一种超级hackish方式使用命令行工具,如opendiff,但它需要在每个字符之间的换行符,因为opendiff是基于行的.

我正在使用ruby,并且没有找到任何工具来执行此操作...但语言并不是非常重要,因为算法可以很容易地移植.

谢谢.

Nul*_*uli 2

这是一个对字符串进行比较的 ruby​​ gem:http://rubydoc.info/gems/diff-lcs/1.1.3/frames

在此之前,我刚刚做了(在 irb 中)

require 'rubygems'
require 'diff/lcs'
require 'diff/lcs/array'
require 'diff/lcs/string'
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

因此,由于这个 2D diff 更改数组,编写插入、内联删除和插入标记的逻辑变得微不足道。

虽然我不确定这是否是最好的方法。