小编bee*_*502的帖子

Doc2vec:如何获取文档向量

如何使用Doc2vec获取两个文本文档的文档向量？我是新手,所以如果有人能指出我正确的方向/帮助我一些教程会很有帮助

我正在使用gensim.

doc1=["This is a sentence","This is another sentence"]
documents1=[doc.strip().split(" ") for doc in doc1 ]
model = doc2vec.Doc2Vec(documents1, size = 100, window = 300, min_count = 10, workers=4)

Run Code Online (Sandbox Code Playgroud)

我明白了

AttributeError:'list'对象没有属性'words'

每当我跑这个.

python gensim word2vec

bee*_*502

2018 12-16

51
推荐指数

3
解决办法

6万
查看次数

Gensim Word2vec:语义相似度

我想知道gensim word2vec的两个相似性度量之间的区别:most_similar()和most_similar_cosmul().我知道第一个使用单词向量的余弦相似性,而另一个使用Omer Levy和Yoav Goldberg提出的乘法组合目标.我想知道它对结果有何影响？哪一个给出语义相似性？等.例如:

model = Word2Vec(sentences, size=100, window=5, min_count=5, workers=4)
model.most_similar(positive=['woman', 'king'], negative=['man'])

Run Code Online (Sandbox Code Playgroud)

结果:[('queen',0.50882536),...]

model.most_similar_cosmul(positive=['baghdad', 'england'], negative=['london'])

Run Code Online (Sandbox Code Playgroud)

结果:[(u'iraq',0.8488819003105164),...]

bee*_*502

lucky-day

11
推荐指数

1
解决办法

4654
查看次数

标签统计

gensim ×2

python ×2

word2vec ×2

semantics ×1

similarity ×1

Doc2vec:如何获取文档向量

Gensim Word2vec:语义相似度

标签 统计

小编bee_502的帖子

标签统计