Thu*_*tne 1 python cluster-analysis machine-learning time-series k-means
如果我不使用 DTW 作为距离度量,那么 tslearn.clustering.TimeSeriesKMeans 和 sklearn.cluster.KMeans 是否相等?
如果不是,有人可以告诉我这两个软件包之间的主要区别是什么?
主要区别仅在于您可以将“dtw”作为 tslearn Kmeans 中的度量标准,这有助于对不同长度的时间序列数据进行聚类,而在 sklearn 中,如果您的时间序列数据长度不同,则会出错,主要是因为它每次都考虑标记为新功能,当您的数据不是矩阵格式时,它会将其视为错误格式。
有趣的是 tslearn 本身在后台使用 sklearn。
但是,tslearn 在对 2 以外的不同“n_clusters”的数据进行聚类时可能会出现问题,例如,说 3。/它有时只预测 2 个标签。 在这里我提到制作 4 个集群,但它只给出了 2 个标签