Rob*_*bin 5 statistics r cluster-analysis k-means
是否可以为特定数据集的每次执行获取相同的kmeans集群.就像随机值一样,我们可以使用固定种子.是否可以停止聚类的随机性?
And*_*rie 14
是.用set.seed
做集群之前设置为随机值的种子.
使用以下示例kmeans
:
set.seed(1)
x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 2),
matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 2))
colnames(x) <- c("x", "y")
set.seed(2)
XX <- kmeans(x, 2)
set.seed(2)
YY <- kmeans(x, 2)
Run Code Online (Sandbox Code Playgroud)
测试平等:
identical(XX, YY)
[1] TRUE
Run Code Online (Sandbox Code Playgroud)