小编The_nce的帖子

这个 kmeans 聚类的最佳 k 是多少？（肘点图）

我正在尝试使用 kmeans 寻找在首尔地铁站附近开设咖啡店的最佳地点。

包括的功能有：

每月在特定车站下车的总人数
特定车站附近的租金
特定车站附近现有咖啡店的数量

我决定使用肘点来找到最好的 k。在运行 kmeans 之前，我确实对所有功能进行了标准化。

现在肘点似乎是 k=3（或者 k=2），但我认为 SSE 对于肘点来说太高了。

同样使用 k=3，很难从集群中获得洞察力，因为只有三个集群。

使用 k=5 是获得洞察力的最佳选择。

即使不是肘点，使用 k=5 是否合理？

还是首先 kmeans 不是一个好的选择？

python cluster-analysis machine-learning k-means python-3.x

4
推荐指数

2
解决办法

1333
查看次数

标签统计

cluster-analysis ×1

machine-learning ×1