给定两个文本块,如何生成一个系数来比较它们的相似程度?

Nat*_*ley 1 c# diff

基本上,我不是像普通的diff算法那样寻找具体的差异,我看起来更多的是生成某种数值,它表示两个文本块的差异程度,这样我就可以拿一堆不同的文本块并提取一组那些有资格彼此足够独特的文本块.有任何想法吗?

Joe*_*oey 10

您可以使用Levenshtein距离.