WEKA K-Means聚类

Chr*_*lor 8 cluster-analysis data-mining weka k-means

任何人都能解释一下WEKA中K-Means聚类的输出实际意味着什么.

例如

kMeans


Number of iterations: 9

Within cluster sum of squared errors: 9434.911100488926

Missing values globally replaced with mean/mode

Cluster centroids:

                  Cluster#
Attribute         Full Data          0          1                           
                      (400)      (310)       (90)
=================================================
competency134        0.0425     0.0548          0  
competency207        0.0425     0.0548          0  
competency263          0.01     0.0129          0  
competency264          0.01     0.0129          0  
competency282          0.01     0.0129          0  
competency289          0.01     0.0129          0  
Run Code Online (Sandbox Code Playgroud)

列中的数字实际意味着什么,它表示表格上方的聚类质心,但是如何确定两个聚类的质心是什么?

如果有人能解释这些数字意味着什么,我将非常感激.

如果有人有任何想法如何完成对所发现的聚类的轮廓评估,这也将是很好的.

谢谢

Yuv*_*l F 4

第一列给出了总体人口质心。第二列和第三列分别给出簇 0 和 1 的质心。每行给出特定尺寸的质心坐标。

我相信你需要温习一下你的K-means。寻找质心是算法的重要组成部分。质心是算法特定运行的结果,并且不是唯一的 - 不同的运行可能会生成不同的质心集。

有关更多详细信息,请参阅Michael Abernethy 对 Weka 聚类的描述。