小编Jam*_*mes的帖子

如何获得 word2vec 词汇表中不存在的单词的向量?

我已经检查了之前的帖子链接,但它似乎不适用于我的情况:-

我已经预先训练过 word2vec 模型:

import gensim    
model = Word2Vec.load('w2v_model')
Run Code Online (Sandbox Code Playgroud)

现在我有一个带有关键字的熊猫数据框:

keyword
corruption
people
budget
cambodia
.......
......
Run Code Online (Sandbox Code Playgroud)

我只想在其相应的列中为每个关键字添加向量,但是当我使用model['cambodia']它时会抛出错误KeyError: "word 'cambodia' not in vocabulary"

所以我将关键字更新为:

model.train(['cambodia'])
Run Code Online (Sandbox Code Playgroud)

但这对我不起作用,当我使用 model['cambodia']

它仍然给出错误为KeyError: "word 'cambodia' not in vocabulary". 如何将新单词更新为 word2vec 词汇表,以便我可以获得它的向量?预期输出将是:-

keyword    V1         V2          V3         V4            V5         V6   
corruption 0.07397  0.290874    -0.170812   0.085428    -0.148551   0.38846 
people      ..............................................................
budget      ...........................................................
Run Code Online (Sandbox Code Playgroud)

python-3.x pandas gensim text-classification word2vec

6
推荐指数
1
解决办法
754
查看次数

比较同一列表中的两个相邻元素

我已经通过了一个帖子,但我想知道在使用for循环时我的代码中出错了什么.

列表a如下:

a = [2, 4, 7,1,9, 33]
Run Code Online (Sandbox Code Playgroud)

我只想比较两个相邻的元素:

2 4
4 7
7 1
1 9
9 33
Run Code Online (Sandbox Code Playgroud)

我做了类似的事情:

for x in a:
    for y in a[1:]:
        print (x,y)
Run Code Online (Sandbox Code Playgroud)

python list-comprehension list python-3.x

3
推荐指数
2
解决办法
463
查看次数