在KMeans算法中获取每个群集中的值数

Question

如何在熊猫的KMeans算法中获取每个群集中的值总数？

我尝试了以下方法：

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe.iloc[:,:])
clusters = kmeans_model.labels_.count()

但它不起作用。

我的预期输出是：

Clusters   Number_of_values
cluster_0  932
cluster_1  931
cluster_2  930

知道如何在Pandas中实现这一目标吗？

我也尝试过，它有效。如果我有其他选择的话会更好。

from collections import Counter
print(Counter(kmeans_model.labels_))

提前致谢。

Answer 1

你可以这样做

向数据框添加群集编号列

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe)

dataframe['kmean'] = kmeans_model.labels_

然后数一下

dataframe['kmean'].value_counts()