如何使用 gensim 工具包查找单词的同义词或多词释义

Qua*_*tum 1 python nlp word-sense-disambiguation gensim word2vec

使用 gensim 工具包加载了一个预训练的 word2vec 模型后,我想找到一个词的同义词,给定上下文,例如“她是一个聪明的人”的智能。

goj*_*omo 5

有一种方法[most_similar()][1]可以通过模型坐标中的余弦相似性将最接近的向量的单词报告给给定的单词。例如:

similars = loaded_w2v_model.most_similar('bright')
Run Code Online (Sandbox Code Playgroud)

然而,Word2vec 不会找到严格的同义词——只是在其训练语料库中与上下文相关的词。这些通常类似于同义词,但也可以在其他方面相似——例如用于相同的主题域,或者能够在功能上相互替换。(在最后一个方面,有时高度相似的词向量用于反义词,因为像“hot”和“cold”这样的词出现在相同的地方,指代某事物的同一方面。)

简单的 word2vec 也不能很好地处理多义词(像“明亮”这样的标记既是“光线充足”的词又是“智能”的词)。因此,“明亮”的最相似词列表将包括其替代意义的混合。