LevensteinDistance - Commons Lang 3.0 API

Deb*_*Deb 8 java api levenshtein-distance

使用Commons Lang api,我可以通过LevensteinDistance计算两个字符串之间的相似性.结果是将一个字符串更改为另一个字符串所需的更改次数.我希望结果在0到1的范围内,这样可以更容易地识别字符串之间的相似性.结果将更接近0相似性.可能吗?

在我正在使用的示例下面:

public class TesteLevenstein {

    public static void main(String[] args) {      

        int distance1 = StringUtils.getLevenshteinDistance("Boat", "Coat");
        int distance2 = StringUtils.getLevenshteinDistance("Remember", "Alamo");
        int distance3 = StringUtils.getLevenshteinDistance("Steve", "Stereo");

        System.out.println("distance(Boat, Coat): " + distance1);
        System.out.println("distance(Remember, Alamo): " + distance2);
        System.out.println("distance(Steve, Stereo): " + distance3);        

    }
}
Run Code Online (Sandbox Code Playgroud)

谢谢!

MRA*_*RAB 11

只差一些数字.问题是什么号码?可能是给定字符串对的最大可能距离.我认为这是较长字符串的长度(即所有字符都不同,再添加一些字符串,与较短字符串相比).

  • "_可能是给定字符串对的最大可能距离."是正确的. (5认同)