sklearn KMeans 中 KMeans.cluster_centers_ 的值

Kat*_*ine 5 python k-means scikit-learn

在做 K 意味着适合一些具有 3 个集群的向量时,我能够获得输入数据的标签。 KMeans.cluster_centers_返回中心的坐标,所以不应该有一些与之对应的向量吗?如何在这些簇的质心处找到值?

小智 9

closest, _ = pairwise_distances_argmin_min(KMeans.cluster_centers_, X)

该数组closest将包含 X 中最接近每个质心的点的索引。

假设三个集群的closest给定输出array([0,8,5])。所以X[0]是X中离质心0最近的点,X[8]是离质心1最近的点,依此类推。

来源:https : //codedump.io/share/XiME3OAGY5Tm/1/get-nearest-point-to-centroid-scikit-learn


big*_*sim 5

聚类中心值是质心的值。在 k 均值聚类结束时,您将拥有三个单独的聚类和三个质心,每个质心位于每个聚类的中心。质心不一定必须与现有数据点重合。

  • 我不太确定你的意思。您会得到一个定义集群的质心(每个数据点都位于最接近的质心的集群中)。您拥有质心的值 - 该值包含在“cluster_centers_”中 - 但质心是一个新点,而不是现有的数据点之一。它_可能_偶然对应于现有点,但并非必须如此。 (2认同)