word2vec - 什么是最好的？添加,连接或平均单词向量？

Lem*_*mon 6 python gensim word2vec language-model word-embedding

我正在研究一种复发语言模型.要学习可用于初始化我的语言模型的单词嵌入,我使用的是gensim的word2vec模型.训练之后,word2vec模型为词汇表中的每个单词保存两个向量:单词嵌入(输入/隐藏矩阵的行)和上下文嵌入(隐藏/输出矩阵的列).

作为概括这个帖子有这两个嵌入矢量组合至少三种常用的方法:

总结每个单词的上下文和单词向量
求和和求平均值
连接上下文和单词向量

但是,我找不到关于最佳策略的适当论文或报告.所以我的问题是:

是否对向量求和,平均或连接有共同的解决方案吗？
或者最好的方法完全取决于相关任务？如果是这样,什么策略最适合单词级语言模型？
为什么要结合载体？为什么不对每个单词使用"原始"单词嵌入,即包含在输入和隐藏神经元之间的权重矩阵中的单词嵌入.

相关(但未答复)的问题:

我在斯坦福讲座“自然语言处理的深度学习”（第 2 课，2016 年 3 月）中找到了答案。它可以在这里找到。在第 46 分钟中，Richard Socher 指出常用的方法是对两个词向量求平均。

归档时间：	8 年前
查看次数：	7634 次
最近记录：	6 年，7 月前

如何使用 word2vec 获取给定单词的词嵌入向量和上下文向量？ 6

如何连接词向量以形成句子向量 3

更多相关链接

如何检查Python中的字符串是否为ASCII？ 197

用熊猫中的NaN替换空白值(空格) 129

调用函数时将列表转换为*args 116

什么是'pythonic'相当于函数式编程的'fold'函数？ 108

在tkinter中切换两帧 78

熊猫 - FillNa与另一栏 70

是否可以在Enum中定义类常量？ 50

如何使用SQLAlchemy使用SELECT COUNT(*)计算行数？ 44

在python中将元素添加到json中 41

如何下载word2vec？ 9

为什么处理排序数组比处理未排序数组更快？ 23665

如何将Git存储库还原为以前的提交 7278

应该在JavaScript比较中使用哪个等于运算符(== vs ===)？ 5666

撤消尚未推送的Git合并 3695

如何克隆特定的Git分支？ 2804

如何在jQuery中选择具有多个类的元素？ 1985

如何分析在Linux上运行的C++代码？ 1732

如何分析Python脚本？ 1203

require,include,require_once和include_once之间的区别？ 1166

"正确"的JSON日期格式 1071