有没有办法在Spark MLlib中运行K-Means时初始化集群中心?
我试过以下:
model = KMeans.train(
sc.parallelize(data), 3, maxIterations=0,
initialModel = KMeansModel([(-1000.0,-1000.0),(5.0,5.0),(1000.0,1000.0)]))
Run Code Online (Sandbox Code Playgroud)
initialModel并且setInitialModel不存在于spark-mllib_2.10中
我在一组数据上使用Weka的SimpleKMeans clusterer.
但我不确定种子价值是什么,它做了什么或它如何影响数据.
即较高或较低的种子值如何影响结果,与默认值10相反?