什么是WEKA中的集群评估?

Lon*_*guy 6 java machine-learning data-mining weka

当我们说我们正在评估WEKA frmework中的集群时,我们的意思是什么?聚类是一种无监督的对象分组方法.当我们说要评估结果时,我们的意思是什么?此外,除此之外,当我们说我们在训练数据本身之上评估集群时,这意味着什么?

谢谢Abhishek S.

Sic*_*cco 9

由于写在页:

评估 Weka评估集群的方式取决于您选择的集群模式.有四种不同的群集模式可用(作为群集模式面板中的按钮):

  1. Use training set(默认).生成聚类之后,Weka根据聚类表示将训练实例分类为聚类,并计算落入每个聚类的实例百分比.例如,由k-means产生的上述聚类在聚类0中显示43%(6个实例),在聚类1中显示57%(8个实例).
  2. In Supplied test setPercentage splitWeka可以在单独的测试数据上评估聚类,如果聚类表示是概率性的(例如对于EM).
  3. Classes to clusters evaluation.在这种模式下,Weka首先忽略class属性并生成聚类.然后在测试阶段,它根据每个集群中类属性的多数值为集群分配类.然后,它根据此分配计算分类错误,并显示相应的混淆矩阵.k-means的一个例子如下所示.