在KMeans算法中获取每个群集中的值数

Sab*_*n J 0 python cluster-analysis k-means pandas scikit-learn

如何在熊猫的KMeans算法中获取每个群集中的值总数?

我尝试了以下方法:

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe.iloc[:,:])
clusters = kmeans_model.labels_.count()
Run Code Online (Sandbox Code Playgroud)

但它不起作用。

我的预期输出是:

Clusters   Number_of_values
cluster_0  932
cluster_1  931
cluster_2  930
Run Code Online (Sandbox Code Playgroud)

知道如何在Pandas中实现这一目标吗?

我也尝试过,它有效。如果我有其他选择的话会更好。

from collections import Counter
print(Counter(kmeans_model.labels_))
Run Code Online (Sandbox Code Playgroud)

提前致谢。

M_S*_*S_N 5

你可以这样做

向数据框添加群集编号列

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe)

dataframe['kmean'] = kmeans_model.labels_
Run Code Online (Sandbox Code Playgroud)

然后数一下

dataframe['kmean'].value_counts()
Run Code Online (Sandbox Code Playgroud)