Numpy修改数组到位？

Question

Numpy修改数组到位？

Use*_*ser 26 python arrays numpy in-place

我有以下代码试图规范化m x n数组的值(它将用作神经网络的输入,其中m是训练示例n的数量,并且是特征的数量).

但是,当我在脚本运行后检查解释器中的数组时,我发现这些值没有规范化; 也就是说,它们仍然具有原始值.我想这是因为array函数内部变量的赋值只能在函数中看到.

我怎样才能实现这种规范化？或者我必须从normalize函数返回一个新数组？

import numpy

def normalize(array, imin = -1, imax = 1):
    """I = Imin + (Imax-Imin)*(D-Dmin)/(Dmax-Dmin)"""

    dmin = array.min()
    dmax = array.max()

    array = imin + (imax - imin)*(array - dmin)/(dmax - dmin)
    print array[0]


def main():

    array = numpy.loadtxt('test.csv', delimiter=',', skiprows=1)
    for column in array.T:
        normalize(column)

    return array

if __name__ == "__main__":
    a = main()

Run Code Online (Sandbox Code Playgroud)

Answer 1

sen*_*rle 24

如果你想数学运算适用于就地一个numpy的数组,你可以简单地使用标准就地运营商+=,-=,/=等,因此,例如:

>>> def foo(a):
...     a += 10
... 
>>> a = numpy.arange(10)
>>> a
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> foo(a)
>>> a
array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

Run Code Online (Sandbox Code Playgroud)

这些操作的就地版本启动速度稍快,特别是对于较大的阵列:

>>> def normalize_inplace(array, imin=-1, imax=1):
...         dmin = array.min()
...         dmax = array.max()
...         array -= dmin
...         array *= imax - imin
...         array /= dmax - dmin
...         array += imin
...     
>>> def normalize_copy(array, imin=-1, imax=1):
...         dmin = array.min()
...         dmax = array.max()
...         return imin + (imax - imin) * (array - dmin) / (dmax - dmin)
... 
>>> a = numpy.arange(10000, dtype='f')
>>> %timeit normalize_inplace(a)
10000 loops, best of 3: 144 us per loop
>>> %timeit normalize_copy(a)
10000 loops, best of 3: 146 us per loop
>>> a = numpy.arange(1000000, dtype='f')
>>> %timeit normalize_inplace(a)
100 loops, best of 3: 12.8 ms per loop
>>> %timeit normalize_copy(a)
100 loops, best of 3: 16.4 ms per loop

Run Code Online (Sandbox Code Playgroud)

Answer 2

Ian*_*cks 5

这是一个技巧，它比这里的其他有用答案更笼统：

def normalize(array, imin = -1, imax = 1):
    """I = Imin + (Imax-Imin)*(D-Dmin)/(Dmax-Dmin)"""

    dmin = array.min()
    dmax = array.max()

    array[...] = imin + (imax - imin)*(array - dmin)/(dmax - dmin)

Run Code Online (Sandbox Code Playgroud)

在这里，我们为视图分配值，array[...]而不是向函数范围内的某些新局部变量分配这些值。

x = np.arange(5, dtype='float')
print x
normalize(x)
print x

>>> [0. 1. 2. 3. 4.]
>>> [-1.  -0.5  0.   0.5  1. ]

Run Code Online (Sandbox Code Playgroud)

编辑：

慢一点它分配一个新的数组。但是，如果您做的事情比较复杂，而内置的就地操作又麻烦又不够用，那么这可能很有价值。

def normalize2(array, imin=-1, imax=1):
    dmin = array.min()
    dmax = array.max()

    array -= dmin;
    array *= (imax - imin)
    array /= (dmax-dmin)
    array += imin

A = np.random.randn(200**3).reshape([200] * 3)
%timeit -n5 -r5 normalize(A)
%timeit -n5 -r5 normalize2(A)

>> 47.6 ms ± 678 µs per loop (mean ± std. dev. of 5 runs, 5 loops each)
>> 26.1 ms ± 866 µs per loop (mean ± std. dev. of 5 runs, 5 loops each)

Run Code Online (Sandbox Code Playgroud)

归档时间：	13 年，8 月前
查看次数：	23244 次
最近记录：	6 年，9 月前