稀疏的矢量与密集的矢量

Ano*_*ffy 14 apache-spark apache-spark-mllib

如何创建SparseVector和密集的矢量表示

如果DenseVector是:

denseV = np.array([0., 3., 0., 4.])
Run Code Online (Sandbox Code Playgroud)

什么是稀疏矢量表示?

Cht*_*ect 21

除非我彻底误解了您的疑问,否则MLlib数据类型文档非常清楚地说明了这一点:

import org.apache.spark.mllib.linalg.Vector;
import org.apache.spark.mllib.linalg.Vectors;

// Create a dense vector (1.0, 0.0, 3.0).
Vector dv = Vectors.dense(1.0, 0.0, 3.0);
// Create a sparse vector (1.0, 0.0, 3.0) by specifying its indices and values corresponding to nonzero entries.
Vector sv = Vectors.sparse(3, new int[] {0, 2}, new double[] {1.0, 3.0});
Run Code Online (Sandbox Code Playgroud)

其中第二个参数Vectors.sparse是索引数组,第三个参数是这些索引中实际值的数组.

  • 点仅表示浮点类型。`1.` 等价于 `1.0` (2认同)

小智 14

稀疏向量是指向量中有很多值为零.而密集向量是指向量中的大多数值不为零时.

如果必须从指定的密集向量创建稀疏向量,请使用以下语法:

Vector sparseVector = Vectors.sparse(4, new int[] {1, 3}, new double[] {3.0, 4.0});
Run Code Online (Sandbox Code Playgroud)