在gensim中加载Word2Vec模型时出错

Tar*_*ula 10 python gensim word2vec

我正在AttributeError加载word2vec存储库中可用的gensim模型:

from gensim import models
w = models.Word2Vec()
w.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
print w["queen"]

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-3-8219e36ba1f6> in <module>()
----> 1 w["queen"]

C:\Anaconda64\lib\site-packages\gensim\models\word2vec.pyc in __getitem__(self, word)
    761 
    762         """
--> 763         return self.syn0[self.vocab[word].index]
    764 
    765 

AttributeError: 'Word2Vec' object has no attribute 'syn0'
Run Code Online (Sandbox Code Playgroud)

这是一个已知的问题 ?

Tar*_*ula 11

修复了以下问题:

from gensim import models
w = models.Word2Vec.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
print w["queen"]
Run Code Online (Sandbox Code Playgroud)


Pra*_*wal 5

为了在不同的训练算法(Word2Vec、Fastext、WordRank、VarEmbed)之间共享词向量查询代码,作者将词向量的存储和查询分离到一个单独的类 KeyedVectors 中。

word2vec 类中的两个方法和几个属性已被弃用。

方法

  • load_word2vec_format
  • save_word2vec_format

属性

  • 同义词
  • 同步
  • 词汇
  • 索引二字

这些已移至 KeyedVectors 类。

升级到此版本后,您可能会收到有关已弃用方法或缺少属性的异常。

要删除异常,您应该使用

KeyedVectors.load_word2vec_format (instead ofWord2Vec.load_word2vec_format)
word2vec_model.wv.save_word2vec_format (instead of  word2vec_model.save_word2vec_format)
model.wv.syn0norm instead of  (model.syn0norm)
model.wv.syn0 instead of  (model.syn0)
model.wv.vocab instead of (model.vocab)
model.wv.index2word instead of (model.index2word)
Run Code Online (Sandbox Code Playgroud)