如何消除Conceptnet中的单词歧义

Cer*_*rin 6 nlp wordnet word-sense-disambiguation conceptnet

Conceptnet包含两种基本类型的节点,单词(例如/ c/en/cat)和感官(例如/ c/en/cat/n/domestic_cat).不幸的是,绝大多数边缘使用字节点.这使得推断变得困难,因为我不能确定单词到单词边缘指的是哪种意义.

例如,Conceptnet包含9个使用单词"cat"的感官,大多数是专有名词(/ c/en/cat/n/musical,/ c/en/cat/n/magazine,/ c/en/cat/n/a_spiteful_woman_gossip等).如果一条边说"/ c/en/cat/r/HasA/c/en/tail",我知道这可能是指使用我自己的经验,这可能是指/ c/en/cat/n/domestic_cat而没有其他感官.然而,如果我看到一条边说"/ c/en/cat/r/IsA/c/en/fun_to_watch",我知道它可能指的是/ c/en/cat/n/musical,但它仍然可能是参考/ c/en/cat/n/domestic_cat.

如何自动执行此过程?如何翻译仅使用单词节点的边缘,以便它们使用感知节点?

ore*_*ano 2

ConceptNet 似乎不包含任何词义消歧,请参阅他们的常见问题解答

到目前为止,ConceptNet 仅做了最低限度的区分词义的工作——在 ConceptNet 5.5 构建的图中,词义仅通过其词性来区分(类似于 sense2vec)。WordNet 对每个单词都有大量的含义,尽管其中一些在实践中很难区分。