如何计算java中两个字符串之间的匹配分数?

Sea*_*yen 5 java fuzzy-comparison

我想将两个字符串分类为相似或不相似.例如

s1 = "Token is invalid. DeviceId = deviceId: "345" "
s2 = "Token is invalid. DeviceId = deviceId: "123" "
s3 = "Could not send Message."
Run Code Online (Sandbox Code Playgroud)

我正在寻找一个可以在两个字符串之间给出匹配分数的java库,从该分数我可以确定它们是否相似.我的程序只需要处理一个小数据集(~2000字符串).你知道那里有什么东西吗?

Eze*_*iel 5

检查Levenshtein距离以获取匹配分数

http://en.wikibooks.org/wiki/Algorithm_Implementation/Strings/Levenshtein_distance#Java

  • http://commons.apache.org/proper/commons-lang/有很多方便的方法,包括Levenshtein距离。 (4认同)