soo*_*h p 10 algorithm wordnet
我想用Wu和Palmer方法计算wordnet中的相似性度量,
wp = (2 X depth(lcs)) / (depth(synset1) + depth(synset2))
Run Code Online (Sandbox Code Playgroud)
其中lcs是的"最不常见subsumer" synset1和synset2
我的问题是:
jus*_*alf 17
根据本文,两个概念A和B的最小公共子集是"最具体的概念,它是A和B的祖先",其中概念树由is-a关系定义.概念被定义为其他概念的祖先,就像您在人类家族树中定义祖先的方式一样,这是其他概念的父母,祖父母等等.例如:
图表:
Object
|
Vehicle
|
---------
| |
Boat Automobile
|
Car
在这种情况下,"汽车"是"汽车"的父母(也是祖先),而"汽车"是"汽车"的祖先."车辆"也是"船"的始祖.在这种情况下,"船"和"汽车"的LCS是"车辆",因为它是最具体的概念,它是"船"和"汽车"的祖先.请注意,虽然"对象"是"船"和"汽车"的共同潜水员,但它并非最不重要,因为仍然有一个"对象"的孩子(在这种情况下它是"车辆"),这也是一个常见的"汽车"和"船"的潜水员."汽车"不是最不常见的潜艇,因为它不是"船"的祖先.
为了计算相似性度量,我建议你使用可用的库,否则你需要自己构建概念图,这很麻烦.
在Perl中,您可以使用WordNet :: Similarity包
在Python中,您可以使用nltk包,特别是 wup_similarity
在Java中,您可以使用ws4j包