我已经检查了之前的帖子链接,但它似乎不适用于我的情况:-
我已经预先训练过 word2vec 模型:
import gensim
model = Word2Vec.load('w2v_model')
Run Code Online (Sandbox Code Playgroud)
现在我有一个带有关键字的熊猫数据框:
keyword
corruption
people
budget
cambodia
.......
......
Run Code Online (Sandbox Code Playgroud)
我只想在其相应的列中为每个关键字添加向量,但是当我使用model['cambodia']它时会抛出错误KeyError: "word 'cambodia' not in vocabulary"
所以我将关键字更新为:
model.train(['cambodia'])
Run Code Online (Sandbox Code Playgroud)
但这对我不起作用,当我使用
model['cambodia']
它仍然给出错误为KeyError: "word 'cambodia' not in vocabulary". 如何将新单词更新为 word2vec 词汇表,以便我可以获得它的向量?预期输出将是:-
keyword V1 V2 V3 V4 V5 V6
corruption 0.07397 0.290874 -0.170812 0.085428 -0.148551 0.38846
people ..............................................................
budget ...........................................................
Run Code Online (Sandbox Code Playgroud) 我已经通过了一个帖子,但我想知道在使用for循环时我的代码中出错了什么.
列表a如下:
a = [2, 4, 7,1,9, 33]
Run Code Online (Sandbox Code Playgroud)
我只想比较两个相邻的元素:
2 4
4 7
7 1
1 9
9 33
Run Code Online (Sandbox Code Playgroud)
我做了类似的事情:
for x in a:
for y in a[1:]:
print (x,y)
Run Code Online (Sandbox Code Playgroud)