Jac*_*ack 3 cluster-analysis machine-learning k-means apache-spark apache-spark-mllib
我正在使用 Spark ML 来运行 Kmeans。我有一堆数据和三个现有的中心,例如这三个中心是:[1.0,1.0,1.0],[5.0,5.0,5.0],[9.0,9.0,9.0].
那么我如何指示 Kmeans 中心是上面的三个向量。我看到 Kmean 对象有种子参数,但种子参数是 long 类型而不是数组。那么我如何告诉 Spark Kmeans 仅使用现有的中心进行聚类。
或者说,我不明白 Spark Kmeans 中种子的含义,我认为种子应该是一个向量数组,在运行聚类之前代表指定的中心。
| 归档时间: |
|
| 查看次数: |
3763 次 |
| 最近记录: |