use*_*675 1 apache-spark apache-spark-ml apache-spark-mllib
我对 spark 完全陌生,我想以编程方式从标记点创建 JavaRDD,而无需从文件中读取输入。假设我创建了几个 Labeledpoints,如下所示,
 LabeledPoint pos = new LabeledPoint(1.0, Vectors.dense(1.0, 0.0, 3.0));
 LabeledPoint pos = new LabeledPoint(1.0, Vectors.dense(1.0, 5.0, 3.0));
 LabeledPoint pos = new LabeledPoint(1.0, Vectors.dense(1.0, 0.0, 3.0));
 LabeledPoint pos = new LabeledPoint(1.0, Vectors.dense(1.0, 7.0, 3.0));
然后我想使用这些向量创建一个 JavaRDD。我怎样才能做到这一点。
检查Apache spark 文档的这一部分。您可以使用 parallelize 函数来创建 rdd。
List<Integer> data = Arrays.asList(1, 2, 3, 4, 5);
JavaRDD<Integer> distData = sc.parallelize(data);
| 归档时间: | 
 | 
| 查看次数: | 315 次 | 
| 最近记录: |