为什么词嵌入实际上是向量？

Question

为什么词嵌入实际上是向量？

com*_*com 4 nlp machine-learning embedding neural-network word2vec

我为我的幼稚而感到抱歉，但我不明白为什么NN训练过程（word2vec）产生的词嵌入实际上是向量。

嵌入是降维的过程，在训练过程中，NN将词的1/0数组缩小为较小的数组，该过程不执行任何应用矢量算法的过程。

因此，结果是我们只有数组而不是向量。为什么将这些数组视为向量？

即使我们得到矢量，为什么每个人都将它们描述为来自原点（0,0）的矢量？

再次，对不起，如果我的问题看起来很愚蠢。

Answer 1

Max*_*xim 5

该过程不执行任何应用向量算术的操作

训练过程与向量运算无关，但是当生成数组时，发现它们具有非常好的属性，因此可以想到“词线性空间”。

例如，在这个空间中，哪些词的嵌入最接近给定的词？

换句话说，意思相近的词形成一片云。这是一个二维 t-SNE 表示：

再比如，“男人”和“女人”之间的距离非常接近“叔叔”和“阿姨”之间的距离：

结果，你有非常合理的算术：

W("woman") ? W("man") ? W("aunt") ? W("uncle")
W("woman") ? W("man") ? W("queen") ? W("king")

Run Code Online (Sandbox Code Playgroud)

所以称它们为vector并不牵强。所有图片都来自这篇精彩的帖子，我非常推荐阅读。

@com 来源在词嵌入中并不重要。您可以安全地移动原点（以及所有向量），并且上面的所有这些属性仍将保持不变。重要的是向量的相对定位。 (2认同)

Answer 2

alv*_*vas 5

什么是嵌入物？

单词嵌入是自然语言处理（NLP）中一组语言建模和功能学习技术的总称，其中词汇表中的单词或短语被映射到实数向量。

从概念上讲，它涉及从每个单词一维的空间到具有低维的连续向量空间的数学嵌入。

（来源：https : //en.wikipedia.org/wiki/Word_embedding）

什么是Word2Vec？

Word2vec是一组用于产生单词嵌入的相关模型。这些模型是浅的两层神经网络，经过训练可以重建单词的语言环境。

Word2vec将一个大型文本语料库作为输入，并产生一个通常具有几百个维度的向量空间，该语料库中的每个唯一单词都在该空间中分配了一个对应的向量。

词向量位于向量空间中，以便在语料库中共享公共上下文的词在空间中彼此紧邻。

（来源：https : //en.wikipedia.org/wiki/Word2vec）

什么是数组？

在计算机科学中，数组数据结构（或简称为数组）是由元素（值或变量）的集合组成的数据结构，每个元素均由至少一个数组索引或键标识。

存储一个数组，以便可以通过数学公式从其索引元组计算每个元素的位置。

数据结构的最简单类型是线性数组，也称为一维数组。

什么是向量/向量空间？

向量空间（也称为线性空间）是称为向量的对象的集合，可以将这些对象加在一起并乘以（称为“标量”）数字。

标量通常被视为实数，但是也有矢量空间，其标量乘以复数，有理数或通常任何字段。

向量加法和标量乘法的运算必须满足下面列出的称为公理的某些要求。

（来源：https : //en.wikipedia.org/wiki/Vector_space）

向量和数组有什么区别？