Sal*_*Sal 6 python scikit-learn
我StandardScaler从之前的模型中保存了一个sklearn ,并尝试将其应用于新数据
scaler = myOldStandardScaler
print("ORIG:", X)
print("CLASS:", X.__class__)
X = scaler.fit_transform(X)
print("SCALED:", X)
Run Code Online (Sandbox Code Playgroud)
我有三个观察,每个观察2000个特征.如果我单独运行每个观察,我得到全零的输出.
ORIG: [[ 3.19029839e-04 0.00000000e+00 1.90985485e-06 ..., 0.00000000e+00
0.00000000e+00 0.00000000e+00]]
CLASS: <class 'numpy.matrixlib.defmatrix.matrix'>
SCALED: [[ 0. 0. 0. ..., 0. 0. 0.]]
Run Code Online (Sandbox Code Playgroud)
但是,如果我将所有三个观察结果附加到一个数组中,我得到了我想要的结果
ORIG: [[ 0.00000000e+00 8.69737728e-08 7.53361877e-06 ..., 0.00000000e+00
0.00000000e+00 0.00000000e+00]
[ 9.49627142e-04 0.00000000e+00 0.00000000e+00 ..., 0.00000000e+00
0.00000000e+00 0.00000000e+00]
[ 3.19029839e-04 0.00000000e+00 1.90985485e-06 ..., 0.00000000e+00
0.00000000e+00 0.00000000e+00]]
CLASS: <class 'numpy.matrixlib.defmatrix.matrix'>
SCALED: [[-1.07174217 1.41421356 1.37153077 ..., 0. 0. 0. ]
[ 1.33494964 -0.70710678 -0.98439142 ..., 0. 0. 0. ]
[-0.26320747 -0.70710678 -0.38713935 ..., 0. 0. 0. ]]
Run Code Online (Sandbox Code Playgroud)
我见过这两个问题:
两者都没有得到接受的答案.
我试过了:
np.float32和np.float64(仍为零)np.matrix(再次,全部为零)我错过了什么?输入fit_transform是相同的类型,只是不同的大小.
如何让StandardScaler使用单个观察?
Edu*_*sov 13
当您尝试将对象的fit_transform方法应用于StandardScaler大小(1,n)的数组时,您显然会得到全零,因为对于每个数组,您从它中减去该数字的平均值,该数字等于数字并除以此数字的std数.如果要获得正确的数组scalling,则应将其转换为size(n,1)的数组.你可以这样做:
import numpy as np
X = np.array([1, -4, 5, 6, -8, 5]) # here should be your X in np.array format
X_transformed = scaler.fit_transform(X[:, np.newaxis])
Run Code Online (Sandbox Code Playgroud)
在这种情况下,您可以通过它的功能获得一个对象的标准缩放,这不是您正在寻找的.如果要通过3个对象的一个特征进行缩放,则应传递给fit_transform大小为(3,1)的方法数组,其中某些特征的值与每个对象相对应.
X = np.array([0.00000000e+00, 9.49627142e-04, 3.19029839e-04])
X_transformed = scaler.fit_transform(X[:, np.newaxis]) # you should get
# array([[-1.07174217], [1.33494964], [-0.26320747]]) you're looking for
Run Code Online (Sandbox Code Playgroud)
如果您想使用已安装的StandardScaler对象,则不应使用fit_transform方法,因为它会使用新数据重新对象.StandardScaler有transform方法,与单一观察一起工作:
X = np.array([1, -4, 5, 6, -8, 5]) # here should be your X in np.array format
X_transformed = scaler.transform(X.reshape(1, -1))
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2509 次 |
| 最近记录: |