scikit-learn kmeans自定义距离

Nil*_*ehn 5 python scikit-learn

我希望使用kmeans算法对某些数据进行聚类,但是我想使用自定义距离函数。有什么办法可以更改scikit-learn使用的距离函数?

我还将选择一个不同的框架/模块,该框架/模块可以交换距离函数并可以并行计算kmeans(我想加快计算速度,这是scikit-learn的一个不错的功能)

有什么建议么?

gow*_*oww 3

您可以尝试谱聚类算法,它允许您输入自己的距离矩阵(根据您的喜好计算)。

它在凸边界上的性能与 K-means 没有什么可比的,但在非凸问题上也能发挥作用(检测连通性)。在这里查看更多内容。

好消息是scikit-learn 中也实现了谱聚类。

希望能帮助到你。