使用距离矩阵进行聚类

yas*_*sin 11 algorithm cluster-analysis distance matrix

我有一个(对称)矩阵M,表示每对节点之间的距离.例如,

    A   B   C   D   E   F   G   H   I   J   K   L
A   0  20  20  20  40  60  60  60 100 120 120 120
B  20   0  20  20  60  80  80  80 120 140 140 140
C  20  20   0  20  60  80  80  80 120 140 140 140
D  20  20  20   0  60  80  80  80 120 140 140 140
E  40  60  60  60   0  20  20  20  60  80  80  80
F  60  80  80  80  20   0  20  20  40  60  60  60
G  60  80  80  80  20  20   0  20  60  80  80  80
H  60  80  80  80  20  20  20   0  60  80  80  80
I 100 120 120 120  60  40  60  60   0  20  20  20
J 120 140 140 140  80  60  80  80  20   0  20  20
K 120 140 140 140  80  60  80  80  20  20   0  20
L 120 140 140 140  80  60  80  80  20  20  20   0

是否有任何方法可以从中提取集群M(如果需要,可以修复集群的数量),这样每个集群都包含它们之间距离较小的节点.在示例中,群集将是(A, B, C, D),(E, F, G, H)(I, J, K, L).

非常感谢 :)

Bjö*_*lex 8

分层聚类直接与距离矩阵一起工作,而不是实际观察.如果你知道了簇的数量,你就会知道你的停止标准(当有k个簇时停止).这里的主要技巧是选择合适的连接方法.此外,本文(pdf)对各种聚类方法进行了很好的概述.