小编GH.*_*iou的帖子

Python 层次聚类不一致：不一致的输出意味着什么

我正在尝试学习如何使用scipy.cluster.hierarchy.inconsistant。我从文档和这个中知道第一列和第二列分别代表平均值和标准差；第三个是链接数量，第四个是不一致性系数。
然而，我不明白的是：

计算中包含的所有链接的真正含义是什么？
scipy.hierarchy.cluster.inconfirm(Z, d=2)的d 参数到底有什么作用？

例如，假设 X 矩阵如下：

[[2], [8], [0], [4], [1], [9], [9], [0]]
Run Code Online (Sandbox Code Playgroud)
然后，通过以下方式获取 Z 值

Z = linkage(X, 'single')
Run Code Online (Sandbox Code Playgroud)
并且，我们得到

[[ 2. 7. 0. 2.] [ 5. 6. 0. 2.] [ 0. 4. 1. 2.] [ 8. 10. 1. 4.] [ 1. 9. 1. 3.] [ 3. 11. 2. 5.] [ 12. 13. 4. 8.]]
Run Code Online (Sandbox Code Playgroud)
最后，得到不一致的情况

inconsistent(Z)
Run Code Online (Sandbox Code Playgroud)
输出是

[[ 0. 0. 1. 0. ] [ …
Run Code Online (Sandbox Code Playgroud)

python hierarchy scipy

GH.*_*iou

lucky-day

2
推荐指数

1
解决办法

2023
查看次数

Python、Scikit-learn、K-means：参数 n_init 实际上有什么作用？

我是 Python 初学者。现在，我试图了解sklearn.cluster.KMeans中的参数n_init是什么

从文档中：

n_init：整数，默认值：10

k-means 算法使用不同质心种子运行的次数。最终结果将是n_init连续运行中惯性方面的最佳输出。

起初，我认为这意味着代码运行的次数，直到我发现这个有用的问题，然后我意识到这就是max_iter所做的。

参数n_init到底有什么作用？我真的不明白。

python cluster-analysis machine-learning k-means scikit-learn

GH.*_*iou

2020 06-20

0
推荐指数

1
解决办法

1万
查看次数

标签统计

python ×2

cluster-analysis ×1

hierarchy ×1

k-means ×1

machine-learning ×1

scikit-learn ×1

scipy ×1

Python 层次聚类不一致：不一致的输出意味着什么

Python、Scikit-learn、K-means：参数 n_init 实际上有什么作用？

标签 统计

小编GH._iou的帖子

标签统计