小编GH.*_*iou的帖子

Python 层次聚类不一致:不一致的输出意味着什么

我正在尝试学习如何使用scipy.cluster.hierarchy.inconsistant。我从文档和这个中知道第一列和第二列分别代表平均值和标准差;第三个是链接数量,第四个是不一致性系数。
然而,我不明白的是:

  1. 计算中包含的所有链接的真正含义是什么?
  2. scipy.hierarchy.cluster.inconfirm(Z, d=2)d 参数到底有什么作用?

例如,假设 X 矩阵如下:

[[2], [8], [0], [4], [1], [9], [9], [0]]
Run Code Online (Sandbox Code Playgroud)

然后,通过以下方式获取 Z 值

Z = linkage(X, 'single')
Run Code Online (Sandbox Code Playgroud)

并且,我们得到

[[  2.   7.   0.   2.]
 [  5.   6.   0.   2.]
 [  0.   4.   1.   2.]
 [  8.  10.   1.   4.]
 [  1.   9.   1.   3.]
 [  3.  11.   2.   5.]
 [ 12.  13.   4.   8.]]
Run Code Online (Sandbox Code Playgroud)

最后,得到不一致的情况

inconsistent(Z)
Run Code Online (Sandbox Code Playgroud)

输出是

[[ 0.       0.       1.       0.     ]
 [ …
Run Code Online (Sandbox Code Playgroud)

python hierarchy scipy

2
推荐指数
1
解决办法
2023
查看次数

Python、Scikit-learn、K-means:参数 n_init 实际上有什么作用?

我是 Python 初学者。现在,我试图了解sklearn.cluster.KMeans中的参数n_init是什么

从文档中:

n_init:整数,默认值:10

k-means 算法使用不同质心种子运行的次数。最终结果将是n_init连续运行中惯性方面的最佳输出。

起初,我认为这意味着代码运行的次数,直到我发现这个有用的问题,然后我意识到这就是max_iter所做的。

参数n_init到底有什么作用?我真的不明白。

python cluster-analysis machine-learning k-means scikit-learn

0
推荐指数
1
解决办法
1万
查看次数