我正在尝试学习如何使用scipy.cluster.hierarchy.inconsistant。我从文档和这个中知道第一列和第二列分别代表平均值和标准差;第三个是链接数量,第四个是不一致性系数。
然而,我不明白的是:
例如,假设 X 矩阵如下:
[[2], [8], [0], [4], [1], [9], [9], [0]]
Run Code Online (Sandbox Code Playgroud)
然后,通过以下方式获取 Z 值
Z = linkage(X, 'single')
Run Code Online (Sandbox Code Playgroud)
并且,我们得到
[[ 2. 7. 0. 2.]
[ 5. 6. 0. 2.]
[ 0. 4. 1. 2.]
[ 8. 10. 1. 4.]
[ 1. 9. 1. 3.]
[ 3. 11. 2. 5.]
[ 12. 13. 4. 8.]]
Run Code Online (Sandbox Code Playgroud)
最后,得到不一致的情况
inconsistent(Z)
Run Code Online (Sandbox Code Playgroud)
输出是
[[ 0. 0. 1. 0. ]
[ …
Run Code Online (Sandbox Code Playgroud) 我是 Python 初学者。现在,我试图了解sklearn.cluster.KMeans中的参数n_init是什么
从文档中:
n_init:整数,默认值:10
k-means 算法使用不同质心种子运行的次数。最终结果将是n_init连续运行中惯性方面的最佳输出。
起初,我认为这意味着代码运行的次数,直到我发现这个有用的问题,然后我意识到这就是max_iter所做的。
参数n_init到底有什么作用?我真的不明白。
python cluster-analysis machine-learning k-means scikit-learn