相关疑难解决方法(0)

我在早上,下午和晚上都有38套公寓和电力消耗的数据集.我正在尝试使用scikit-learn的k-Means实现来聚类这个数据集,并且我得到了一些有趣的结果.

第一个聚类结果:

这一切都很好,有4个簇我显然得到4个标签与每个公寓相关联 - 0,1,2和3.使用方法的random_state参数KMeans,我可以修复质心随机初始化的种子,所以始终如一获得归属于同一公寓的相同标签.

然而,由于该特定情况是关于能量消耗,因此可以执行最高和最低消费者之间的可测量分类.因此,我希望将标签0分配给消费水平最低的公寓,将标签1分配给消耗更多的公寓,依此类推.

截至目前,我的标签是[2 1 3 0],或["黑色","绿色","蓝色","红色"]; 我希望他们是[0 1 2 3]或["红色","绿色","黑色","蓝色"].我应该如何继续这样做,同时仍然保持质心初始化随机(使用固定种子)？

非常感谢你的帮助!

9
推荐指数

1
解决办法

6216
查看次数