我想用Wu和Palmer方法计算wordnet中的相似性度量,
wp = (2 X depth(lcs)) / (depth(synset1) + depth(synset2))
Run Code Online (Sandbox Code Playgroud)
其中lcs是的"最不常见subsumer" synset1和synset2
我的问题是:
为了计算两个字符串的Jaro距离,我们使用以下公式:
dj = 1/3(m/| s1 | + m/| s2 | +(mt)/ m)
我应该如何计算这个等式中两个字符串的"m"?
如果"m"是两个字符串之间的差异,为什么维基百科上的示例为两个字符串"MARTHA"和"MARHTA",m为6.我认为它应该是1,因为字符串之间的差异是1而不是6 !我对吗?