相关疑难解决方法(0)

scipy.cluster.hierarchy教程

我试图理解如何操纵层次结构集群,但文档太......技术性?......我无法理解它是如何工作的.

是否有任何教程可以帮助我开始,逐步解释一些简单的任务?

假设我有以下数据集:

a = np.array([[0,   0  ],
              [1,   0  ],
              [0,   1  ],
              [1,   1  ], 
              [0.5, 0  ],
              [0,   0.5],
              [0.5, 0.5],
              [2,   2  ],
              [2,   3  ],
              [3,   2  ],
              [3,   3  ]])
Run Code Online (Sandbox Code Playgroud)

我可以轻松地完成层次结构聚类并绘制树形图:

z = linkage(a)
d = dendrogram(z)
Run Code Online (Sandbox Code Playgroud)
  • 现在,我如何恢复特定群集?让我们说[0,1,2,4,5,6]树状图中有元素的那个?
  • 我怎样才能找回那些元素的价值?

python hierarchical-clustering scipy

33
推荐指数
1
解决办法
4万
查看次数

Python scipy/numpy中的相关性的层次聚类?

如何在scipy/中的相关矩阵上运行层次聚类numpy?我有一个100行乘9列的矩阵,我想通过9个条件中每个条目的相关性进行分层聚类.我想使用1-pearson相关作为聚类的距离.假设我有一个包含100 x 9矩阵的numpy数组X,我该怎么做?

我尝试使用hcluster,基于这个例子:

Y=pdist(X, 'seuclidean')
Z=linkage(Y, 'single')
dendrogram(Z, color_threshold=0)
Run Code Online (Sandbox Code Playgroud)

但是,pdist这不是我想要的,因为这是一个欧几里德距离.有任何想法吗?

谢谢.

python numpy cluster-analysis machine-learning scipy

10
推荐指数
1
解决办法
9145
查看次数