替换大于某个值的Python NumPy Array的所有元素

NLi*_*0Me 165 python arrays replace numpy conditional-statements

我有一个2D NumPy数组,并希望将其中的所有值替换为大于或等于阈值T的255.0.据我所知,最基本的方式是:

shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
    for y in range(0, shape[1]):
        if arr[x, y] >= T:
            result[x, y] = 255
Run Code Online (Sandbox Code Playgroud)
  1. 什么是最简洁和pythonic的方式来做到这一点?

  2. 有没有更快(可能不那么简洁和/或更少pythonic)的方式来做到这一点?

这将是用于人体头部的MRI扫描的窗口/水平调整子程序的一部分.2D numpy数组是图像像素数据.

mdm*_*dml 289

我认为最快和最简洁的方法是使用Numpy的内置索引.如果您有一个ndarray名称arr,则可以>255使用以下值替换所有元素x:

arr[arr > 255] = x
Run Code Online (Sandbox Code Playgroud)

我在我的机器上用500 x 500随机矩阵运行它,用5替换所有值> 0.5,平均花费7.59ms.

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop
Run Code Online (Sandbox Code Playgroud)

  • 注意:如果数据在python列表中,这不起作用,它必须在一个numpy数组(`np.array([1,2,3]`) (4认同)
  • 没关系它可以在多个维度上正常工作 (3认同)
  • 请注意,这会修改现有数组 `arr`,而不是像在 OP 中那样创建一个 `result` 数组。 (3认同)
  • 有没有办法通过不修改`A`而是创建一个新数组来做到这一点? (2认同)
  • 是否可以使用此索引无条件更新每个值?我想这样做:`数组[?] = x`,将每个值设置为 x。其次,是否可以执行多个条件,例如:`array[?] = 255 if array[i] > 127 else 0` 我想优化我的代码,目前正在使用列表理解,它比这种花哨的索引要慢得多。 (2认同)

ask*_*han 43

既然你真的想要一个不同的数组这是arr哪里arr < 255,并且255否则,这可以简单地完成:

result = np.minimum(arr, 255)
Run Code Online (Sandbox Code Playgroud)

更一般地说,对于较低和/或上限:

result = np.clip(arr, 0, 255)
Run Code Online (Sandbox Code Playgroud)

如果你只是想访问超过255的值,或更复杂的东西,@ mtitan8的答案是比较一般,但是np.clipnp.minimum(或np.maximum)也比较好,对你的情况要快得多:

In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop

In [293]: %%timeit
   .....: c = np.copy(a)
   .....: c[a>255] = 255
   .....: 
10000 loops, best of 3: 86.6 µs per loop
Run Code Online (Sandbox Code Playgroud)

如果你想在原地进行(即修改arr而不是创建result),你可以使用以下out参数np.minimum:

np.minimum(arr, 255, out=arr)
Run Code Online (Sandbox Code Playgroud)

要么

np.clip(arr, 0, 255, arr)
Run Code Online (Sandbox Code Playgroud)

(该out=名称是可选的,因为参数的顺序与函数的定义相同.)

对于就地修改,布尔索引加速了很多(无需单独制作然后修改副本),但仍然没有minimum:

In [328]: %%timeit
   .....: a = np.random.randint(0, 300, (100,100))
   .....: np.minimum(a, 255, a)
   .....: 
100000 loops, best of 3: 303 µs per loop

In [329]: %%timeit
   .....: a = np.random.randint(0, 300, (100,100))
   .....: a[a>255] = 255
   .....: 
100000 loops, best of 3: 356 µs per loop
Run Code Online (Sandbox Code Playgroud)

相比之下,如果你想用最小值和最大值限制你的值,clip你不必这样做两次,比如像

np.minimum(a, 255, a)
np.maximum(a, 0, a)
Run Code Online (Sandbox Code Playgroud)

要么,

a[a>255] = 255
a[a<0] = 0
Run Code Online (Sandbox Code Playgroud)


Ami*_*r F 12

我认为你可以通过使用这个where函数来实现这一目标:

例如,在numpy数组中查找大于0.2的项并将其替换为0:

import numpy as np

nums = np.random.rand(4,3)

print np.where(nums > 0.2, 0, nums)
Run Code Online (Sandbox Code Playgroud)


lev*_*lev 8

您可以考虑使用numpy.putmask:

np.putmask(arr, arr>=T, 255.0)
Run Code Online (Sandbox Code Playgroud)

这是与Numpy的内置索引的性能比较:

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)

In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop

In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop
Run Code Online (Sandbox Code Playgroud)


Shi*_*hah 8

另一种方法是使用np.place它进行就地替换并与多维数组一起使用:

import numpy as np

arr = np.arange(6).reshape(2, 3)
np.place(arr, arr == 0, -10)
Run Code Online (Sandbox Code Playgroud)


小智 6

np.where() 效果很好!

np.where(arr > 255, 255, arr)
Run Code Online (Sandbox Code Playgroud)

例子:

FF = np.array([[0, 0],
              [1, 0],
              [0, 1],
              [1, 1]])
np.where(FF == 1, '+', '-')
Out[]: 
array([['-', '-'],
       ['+', '-'],
       ['-', '+'],
       ['+', '+']], dtype='<U1')
Run Code Online (Sandbox Code Playgroud)


小智 5

您还可以使用&, |(和/或)以获得更大的灵活性:

5 到 10 之间的值: A[(A>5)&(A<10)]

大于 10 或小于 5 的值: A[(A<5)|(A>10)]