C-J*_*Jay 7 python parameters cluster-analysis k-means scikit-learn
我想了解 sklearn.cluster.KMeans 类中的参数max_iter。
根据文档:
max_iter : int, default: 300
Maximum number of iterations of the k-means algorithm for a single run.
Run Code Online (Sandbox Code Playgroud)
但在我看来,如果我有 100 个对象,代码必须运行 100 次,如果我有 10.000 个对象,代码必须运行 10.000 次才能对每个对象进行分类。另一方面,在所有对象上运行多次是没有意义的。
我的误解是什么,我该如何解释这个参数?
看看这里:
https://www.naftaliharris.com/blog/visualizing-k-means-clustering/
每次单击更新质心时,都会执行一次新的迭代。这是有道理的,因为当质心移动时,到这些质心的距离也会改变,并且一些点可能会改变簇。