StandardScaler 无法正确缩放

Question

StandardScaler 无法正确缩放

Bra*_*ana 1 python pandas scikit-learn theano sklearn-pandas

我正在尝试使用 StandardScaler 来缩放神经网络的功能。

可以说神经网络具有以下特征：

1.0  2.0   3.0
4.0  5.0   6.0
4.0  11.0  12.0
etc ...

Run Code Online (Sandbox Code Playgroud)

当我将 StandardScaler 应用于整个事物（所有行）时，我得到第一行的以下结果：

['-0.920854068785', '-0.88080603151', '-0.571888559111']

Run Code Online (Sandbox Code Playgroud)

当我尝试仅将 StandardScaler 应用于第一行（仅由第一行组成的矩阵）时，我得到完全不同的结果。

['0.0', '0.0', '0.0']

Run Code Online (Sandbox Code Playgroud)

显然，神经网络不会以这种方式工作，因为行不一样。有没有办法以某种方式使用标准标量器，以便我每次对于相同的输入（行）都得到相同的结果？

这是代码和输出：

from sklearn.preprocessing import StandardScaler
import numpy as np
sc = StandardScaler()

#defining the (big) matrix
AR = np.array([[1.0,2.0,3.0],[4.0,5.0,6.0],[4.0,11.0,12.0],[42.0,131.0,1121.0],[41.0,111.0,121.0]])
AR = sc.fit_transform(AR)
print "fited data from big array:"
m=0
for row in AR: 
    m = m + 1
    if m==1:print [str(m) for m in row]

#defining the (small) matrix
AR1 = np.array([[1.0,2.0,3.0]])
AR1 = sc.fit_transform(AR1)
print "fited data from small array"
for row in AR1: 
     print [str(m) for m in row]

Run Code Online (Sandbox Code Playgroud)

输出是：

fited data from big array:
['-0.920854068785', '-0.88080603151', '-0.571888559111']
fited data from small array
['0.0', '0.0', '0.0']

Run Code Online (Sandbox Code Playgroud)

Answer 1

Cth*_*Sky 5

StandardScaler将按平均值移动数据并按std缩放数据，因为您只向其传递一行，所以每一列的平均值是值本身，并且值将移至零。在这里查看更多内容。

>>> sc = StandardScaler()
>>> arr = np.array([[1.0,2.0,3.0]])
>>> sc.fit(arr)

>>> sc.mean_, sc.scale_
array([ 1.,  2.,  3.]), array([ 1.,  1.,  1.]))

Run Code Online (Sandbox Code Playgroud)

在您的情况下，您应该将fit缩放器应用于所有数据，并且对于每一行，您可以使用它transform来获取结果。

sc.fit(data) # this will compute mean and std on all rows
scaled_row = sc.transform(row) # apply shift to a single row

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，11 月前
查看次数：	4190 次
最近记录：	7 年，11 月前