在Python中使用相关矩阵创建聚类

Jas*_* C. 2 python block matrix correlation

总体而言,我有一个21个行业部门的相关矩阵。现在,我想将这21个扇区分为4或5个组,将行为相似的扇区组合在一起。

专家能否向我介绍如何在Python中执行此操作?在此先感谢!

Wes*_*yle 5

您可能会探索Pandas DataFrame.corrscipy.clusterHierarchical Clustering软件包的使用

import pandas as pd
import scipy.cluster.hierarchy as spc


df = pd.DataFrame(my_data)
corr = df.corr().values

pdist = spc.distance.pdist(corr)
linkage = spc.linkage(pdist, method='complete')
idx = spc.fcluster(linkage, 0.5 * pdist.max(), 'distance')
Run Code Online (Sandbox Code Playgroud)

  • 以下是可能感兴趣的 scipy 和 Pandas 使用示例的链接:https://github.com/TheLoneNut/CorrelationMatrixClustering/blob/master/CorrelationMatrixClustering.ipynb (3认同)
  • 获得“idx”后我该如何处理它? (2认同)
  • 这是正确的吗?当然,如果相关性为 0,那么成对距离也为 0,这与我们想要的相反? (2认同)