使用相似矩阵的sklearn分层聚集聚类

Question

使用相似矩阵的sklearn分层聚集聚类

Ish*_*shi 3 python hierarchical-clustering pandas scikit-learn

给定一个距离矩阵，各个教授之间具有相似性：

              prof1     prof2     prof3
       prof1     0        0.8     0.9
       prof2     0.8      0       0.2
       prof3     0.9      0.2     0

Run Code Online (Sandbox Code Playgroud)

我需要对此数据执行分层聚类，其中上面的数据是二维矩阵的形式

       data_matrix=[[0,0.8,0.9],[0.8,0,0.2],[0.9,0.2,0]]

Run Code Online (Sandbox Code Playgroud)

我尝试检查是否可以使用sklearn.cluster AgglomerativeClustering来实现它，但它正在将所有3行视为3个单独的向量，而不是距离矩阵。可以使用this或scipy.cluster.hierarchy完成吗？

Answer 1

Dav*_*ale 7

是的，您可以使用sklearn。您需要设置：

affinity='precomputed'，使用距离矩阵
linkage='complete'或'average'，因为默认链接（Ward）仅适用于坐标输入。

使用预先计算的亲和力，输入矩阵将解释为观察值之间的距离矩阵。以下代码

from sklearn.cluster import AgglomerativeClustering
data_matrix = [[0,0.8,0.9],[0.8,0,0.2],[0.9,0.2,0]]
model = AgglomerativeClustering(affinity='precomputed', n_clusters=2, linkage='complete').fit(data_matrix)
print(model.labels_)

Run Code Online (Sandbox Code Playgroud)

会返回标签[1 0 0]：第一个教授去一个集群，第二个和第三个教授去另一个集群。

归档时间：	8 年前
查看次数：	3073 次
最近记录：	8 年前