KMeans是否在sklearn中自动规范化功能

Nit*_*tin 9 python scikit-learn

我想知道KMeans在进行群集之前是否会自动规范化功能.似乎没有提供输入来请求规范化的选项.

alk*_*lko 16

一个区分数据预处理(标准化,分级,加权等)和机器学习算法应用程序.使用sklearn.preprocessing数据预处理.而且,数据可以由不同的预处理器在链中预处理.

至于K均值,通常仅仅均值化是不够的.一个归一化数据均衡方差沿不同的特征,因为K均值对数据的方差敏感,而具有较大方差的特征更强调结果.所以对于K-means,我建议使用StandardScaler数据预处理.

不要忘记k-means结果对观察的顺序很敏感,值得多次运行算法,在两者之间对数据进行混洗,平均得到的集群并运行最终评估,将这些平均集群中心作为起点.