0x *_*Tps 10 python machine-learning python-3.x scikit-learn
Python 3.5,从sklearn预处理
df = quandl.get('WIKI/GOOGL')
X = np.array(df)
X = preprocessing.scale(X)
Run Code Online (Sandbox Code Playgroud)
Dee*_*k M 13
preprocessing.scale()算法将您的数据放在一个比例上.这对于大量稀疏的数据集很有用.简而言之,您的数据非常分散.例如,X的值可能是这样的:
X = [1,4,400,10000,100000]
稀疏性的问题在于它非常偏颇或在统计学上倾斜.因此,缩放数据会将所有值集中到一个刻度上,从而消除稀疏性.关于它如何在数学细节中工作,这遵循标准化和标准化的相同概念.您可以对这些进行研究,以了解它的详细信息.但为了让生活变得更简单,sklearn算法可以为您完成一切!