Chr*_*lor 8 cluster-analysis data-mining weka k-means
任何人都能解释一下WEKA中K-Means聚类的输出实际意味着什么.
例如
kMeans
Number of iterations: 9
Within cluster sum of squared errors: 9434.911100488926
Missing values globally replaced with mean/mode
Cluster centroids:
Cluster#
Attribute Full Data 0 1
(400) (310) (90)
=================================================
competency134 0.0425 0.0548 0
competency207 0.0425 0.0548 0
competency263 0.01 0.0129 0
competency264 0.01 0.0129 0
competency282 0.01 0.0129 0
competency289 0.01 0.0129 0
Run Code Online (Sandbox Code Playgroud)
列中的数字实际意味着什么,它表示表格上方的聚类质心,但是如何确定两个聚类的质心是什么?
如果有人能解释这些数字意味着什么,我将非常感激.
如果有人有任何想法如何完成对所发现的聚类的轮廓评估,这也将是很好的.
谢谢
第一列给出了总体人口质心。第二列和第三列分别给出簇 0 和 1 的质心。每行给出特定尺寸的质心坐标。
我相信你需要温习一下你的K-means。寻找质心是算法的重要组成部分。质心是算法特定运行的结果,并且不是唯一的 - 不同的运行可能会生成不同的质心集。
有关更多详细信息,请参阅Michael Abernethy 对 Weka 聚类的描述。