Shi*_*tra 6 python algorithm cluster-analysis k-means
根据sklearn kmeans 文档,它说 k-means 需要一个 shape=(n_samples, n_features) 的矩阵。但我提供了一个 shape=(n_samples,n_samples) 的距离矩阵,其中每个索引保存两个字符串之间的距离。时间序列已使用SAX表示形式转换为字符串。
当我用距离矩阵运行聚类时,它给出了很好的结果。可能的原因是什么?据我所知,K-medoids 是与距离矩阵一起使用的。
K-means,顾名思义,使用means。
计算算术平均值需要访问原始特征,不能使用距离矩阵。
K-means 也不使用成对距离。所以距离矩阵对于这个算法来说是没有用的。
选择不同的算法,例如层次聚类。