小编Aka*_*mar的帖子

K-means算法的种子值如何放置?

我试图根据某个给定的数据集对客户进行分组,其中包含出生日期、性别、州、pincode、transaction_id、promocode 等属性。

每次运行该算法时,聚类的轮廓分数与前一个聚类的轮廓分数都会有巨大差异,即结果不一致。这可能是因为数据集的随机种子。这是将属性传递给算法的行。

km1 = KMeans(n_clusters=6, n_init=25, max_iter = 600)
Run Code Online (Sandbox Code Playgroud)

有没有什么方法可以分配集群或优化,以便每次运行程序后,分数都一致且更好?

我正在使用 Python 3 和 scikit-learn。

python cluster-analysis machine-learning k-means scikit-learn

3
推荐指数
1
解决办法
2万
查看次数