确定分层群集中的组

Rob*_*ert 1 machine-learning hierarchical-clustering

我有一个算法可以将数据分组到一个分层的集群树.该算法是Toby Seagram的编程集体智能中描述的算法.树输出是一个二叉树,每个节点都有一个"距离"值,告诉你两个子节点之间的距离.

然后,我可以将其显示为树状图,这使得人体点很容易将值组合在一起.但是我很难想出一个能够自动决定组应该是什么的算法.我希望能够自动确定:

  • 团体数量
  • 应该在每个组中放置哪些点

这有标准算法吗?

Sic*_*cco 5

我认为没有默认的方法来做到这一点.简单的"手动"方法是:

  • 指定您想要/期望的群集数量
  • 设置两个节点之间最大距离的阈值; 距离较大的任何节点都属于另一个集群

有一些自动方法可以确定簇的数量.R动态树剪切包,它可以自动处理这个问题,也可以使用pvclust.以下是另外两种处理此问题的方法,Salvador(2002)Daniels(2006).