The*_*Kid 2 python cluster-analysis data-mining k-means scikit-learn
我有一个用户及其音乐播放的数据集,每个播放都有位置数据。对于每个用户,我想对他们的播放进行聚类,以查看他们是否在给定位置播放音乐。
我计划使用 sci-kit learn k-means 包,但如何让它处理位置数据,而不是默认的欧几里德距离?
一个它工作的例子真的会对我有帮助!
不要将 k 均值与欧几里德距离以外的任何距离一起使用。
K-means不适用于其他距离度量(请参阅曼哈顿距离的 k-medians,k-medoids 又名。任意其他距离函数的 PAM)。
k-means的概念是方差最小化。方差本质上与平方欧氏距离相同,但与其他距离不同。
您考虑过 DBSCAN 吗?sklearn 应该有 DBSCAN,而且它现在应该有索引支持以使其更快。
归档时间: |
|
查看次数: |
1111 次 |
最近记录: |