我试图比较那些与语义相关的术语/表达 - 这些不是完整的句子,也不一定是单个单词; 例如 -
"社交网络服务"和"社交网络"显然密切相关,但如何使用nltk对此进行量化?
显然我甚至错过了代码:
w1 = wordnet.synsets('social network')
Run Code Online (Sandbox Code Playgroud)
返回一个空列表.
关于如何解决这个问题的任何建议?
有一些语义相关性或相似性的衡量标准,但据我所知,它们更好地针对 wordnet 词典中的单个单词或单个表达式进行定义,而不是针对 wordnet 词汇条目的复合词。
这是一个很好的网络实现,它实现了许多基于 wordnet 的相似性测量
如果您有兴趣,可以进一步阅读有关使用 wordnet 相似性解释化合物的内容(尽管不评估化合物的相似性):