小编The*_*nce的帖子

这个 kmeans 聚类的最佳 k 是多少?(肘点图)

我正在尝试使用 kmeans 寻找在首尔地铁站附近开设咖啡店的最佳地点。

包括的功能有:

  1. 每月在特定车站下车的总人数
  2. 特定车站附近的租金
  3. 特定车站附近现有咖啡店的数量

我决定使用肘点来找到最好的 k。在运行 kmeans 之前,我确实对所有功能进行了标准化。

在此处输入图片说明

现在肘点似乎是 k=3(或者 k=2),但我认为 SSE 对于肘点来说太高了。

同样使用 k=3,很难从集群中获得洞察力,因为只有三个集群。

使用 k=5 是获得洞察力的最佳选择。

即使不是肘点,使用 k=5 是否合理?

还是首先 ​​kmeans 不是一个好的选择?

python cluster-analysis machine-learning k-means python-3.x

4
推荐指数
2
解决办法
1333
查看次数