Rob*_*ert 1 machine-learning hierarchical-clustering
我有一个算法可以将数据分组到一个分层的集群树.该算法是Toby Seagram的编程集体智能中描述的算法.树输出是一个二叉树,每个节点都有一个"距离"值,告诉你两个子节点之间的距离.
然后,我可以将其显示为树状图,这使得人体点很容易将值组合在一起.但是我很难想出一个能够自动决定组应该是什么的算法.我希望能够自动确定:
这有标准算法吗?
我认为没有默认的方法来做到这一点.简单的"手动"方法是:
有一些自动方法可以确定簇的数量.R有动态树剪切包,它可以自动处理这个问题,也可以使用pvclust.以下是另外两种处理此问题的方法,Salvador(2002)和Daniels(2006).