使用scikit-learn DBSCAN获取集群成员/元素集群

Pas*_*ogo 2 python machine-learning scikit-learn

我使用dbscan scikit-learn算法进行集群。db = DBSCAN()。fit(X)例如返回8。我的目标是按群集组件恢复群集。我说过X是向量的向量,当我谈到集群成员时,我期望它是X的子向量。有没有人可以帮助我?

abe*_*ger 5

我相信您正在要求对数据集中X的每个项目进行聚类分配。

您可以使用labels_属性。db.labels_这里的每个索引对应于X中的相同索引,因此您可以看到分配。

  • @PascalOuedraogo X[db.labels_ ==i] 返回一个包含多个元素的数组。相反,您可以循环遍历 n_clusters_ 并为每个创建一个不同的数组。就我个人而言,我会制作一个字典,将簇号映射到列表: cluster_dict = {i: X[db.lables==i] for i in xrange(n_clusters_)} (2认同)