如何连接词向量以形成句子向量

Geo*_*ang 3 nlp machine-learning word2vec deep-learning

我在一些文章(Tomas Mikolov...)中了解到,形成句子向量的更好方法是连接词向量。

但由于我的数学笨拙,我仍然不确定细节。

例如,

假设词向量的维数为m;并且一个句子有 n 个单词。

连接操作的正确结果是什么?

它是 1 xm*n 的行向量吗?或 mxn 矩阵?

请指教

谢谢

fnl*_*fnl 5

至少有三种常用的组合嵌入向量的方法;(a) 求和,(b) 求和和平均或 (c) 连接。所以在你的情况下,通过连接,这会给你一个1 x m*a向量,其中a是句子的数量。在其他情况下,向量长度保持不变。请参阅gensim.models.doc2vec.Doc2Vec,dm_concatdm_mean- 它允许您使用这三个选项中的任何一个 [1,2]。

[1] http://radimrehurek.com/gensim/models/doc2vec.html#gensim.models.doc2vec.LabeledLineSentence

[2] https://github.com/piskvorky/gensim/blob/develop/gensim/models/doc2vec.py