rb1*_*992 23 statistics machine-learning scikit-learn
sklearn.preprocessing模块中standardscaler和normalizer有什么区别?不要两者做同样的事情吗?即使用偏差去除均值和比例?
小智 28
从Normalizer文档:
具有至少一个非零分量的每个样本(即数据矩阵的每一行)与其他样本独立地重新缩放,使得其范数(l1或l2)等于1.
通过删除均值和缩放到单位方差来标准化特征
换句话说,Normalizer按行方式和StandardScaler 列方式.Normalizer不会通过偏差移除均值和比例,而是将整行缩放到单位范数.
StandardScaler() 通过去除均值并缩放至单位方差来标准化特征(例如人员数据的特征,即身高、体重)。
(单位方差:单位方差是指随着样本量趋于无穷大,样本的标准差和方差都趋向于1。)
Normalizer() 重新缩放每个样本。例如,独立调整每家公司的股价。
有些股票比其他股票贵。为了解决这个问题,我们将其标准化。标准化器将分别将每家公司的股价转换为相对比例。