沿 numpy 数组中的行进行最小-最大缩放

Question

沿 numpy 数组中的行进行最小-最大缩放

Ji *_*ong 2 python arrays numpy scikit-learn

我有一个 numpy 数组，我想使用以下过程将每一行的值重新调整为 0 到 1 之间的值：

如果沿给定行的最大值为X_max，沿该行的最小值为X_min，则该行中X_rescaled给定条目 ( X)的重新缩放值 ( )应变为：

X_rescaled = (X - X_min)/(X_max - X_min)

Run Code Online (Sandbox Code Playgroud)

例如，让我们考虑以下数组 ( arr)：

arr = np.array([[1.0,2.0,3.0],[0.1, 5.1, 100.1],[0.01, 20.1, 1000.1]])
print arr
array([[  1.00000000e+00,   2.00000000e+00,   3.00000000e+00],
   [  1.00000000e-01,   5.10000000e+00,   1.00100000e+02],
   [  1.00000000e-02,   2.01000000e+01,   1.00010000e+03]])

Run Code Online (Sandbox Code Playgroud)

目前，我正在尝试通过以下方式使用MinMaxscalerfrom scikit-learn：

from sklearn.preprocessing import MinMaxScaler
result = MinMaxScaler(arr)

Run Code Online (Sandbox Code Playgroud)

但是，我不断得到我的初始数组，即result结果arr与上述方法中的相同。我究竟做错了什么？

如何arr以我需要的方式缩放数组（沿每个轴的最小-最大缩放？）提前致谢。

Answer 1

Pau*_*zer 7

MinMaxScaler使用起来有点笨拙；sklearn.preprocessing.minmax_scale更方便。这沿列操作，因此使用转置：

>>> import numpy as np
>>> from sklearn import preprocessing
>>>                                                                                                                 
>>> a = np.random.random((3,5))                                                            
>>> a                                                                                                               
array([[0.80161048, 0.99572497, 0.45944366, 0.17338664, 0.07627295],                                                
       [0.54467986, 0.8059851 , 0.72999058, 0.08819178, 0.31421126],                                                
       [0.51774372, 0.6958269 , 0.62931078, 0.58075685, 0.57161181]])                                               
>>> preprocessing.minmax_scale(a.T).T                                                                
array([[0.78888024, 1.        , 0.41673812, 0.10562126, 0.        ],                                                
       [0.63596033, 1.        , 0.89412757, 0.        , 0.314881  ],                                                
       [0.        , 1.        , 0.62648851, 0.35384099, 0.30248836]])                                               
>>>
>>> b = np.array([(4, 1, 5, 3), (0, 1.5, 1, 3)])
>>> preprocessing.minmax_scale(b.T).T
array([[0.75      , 0.        , 1.        , 0.5       ],
       [0.        , 0.5       , 0.33333333, 1.        ]])

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，3 月前
查看次数：	2960 次
最近记录：	7 年，3 月前