Jon*_*ine 3 python arrays numpy
我基本上想用 numpy 裁剪图像——我有一个 3 维numpy.ndarray对象,即:
[ [0,0,0,0], [255,255,255,255], ....]
[0,0,0,0], [255,255,255,255], ....] ]
Run Code Online (Sandbox Code Playgroud)
我想删除空格,在上下文中,它是[0,0,0,0].
对于这个例子,让每个像素只是一个数字,我试图基本上做到这一点:
鉴于此:*编辑:选择一个稍微复杂的例子来澄清
[ [0,0,0,0,0,0]
[0,0,1,1,1,0]
[0,1,1,0,1,0]
[0,0,0,1,1,0]
[0,0,0,0,0,0]]
我正在尝试创建这个:
[ [0,1,1,1],
[1,1,0,1],
[0,0,1,1] ]
我可以用循环来暴力破解,但直觉上我觉得 numpy 有更好的方法来做到这一点。
通常,您需要查看scipy.ndimage.label并scipy.ndimage.find_objects提取满足条件的连续区域的边界框。
但是,在这种情况下,您可以使用“普通”numpy 轻松完成。
我假设你nrows x ncols x nbands在这里有一个数组。的另一个约定nbands x nrows x ncols也很常见,所以看看你的数组的形状。
考虑到这一点,您可能会执行类似以下操作:
mask = im == 0
all_white = mask.sum(axis=2) == 0
rows = np.flatnonzero((~all_white).sum(axis=1))
cols = np.flatnonzero((~all_white).sum(axis=0))
crop = im[rows.min():rows.max()+1, cols.min():cols.max()+1, :]
Run Code Online (Sandbox Code Playgroud)
对于您的 2D 示例,它看起来像:
import numpy as np
im = np.array([[0,0,0,0,0,0],
[0,0,1,1,1,0],
[0,1,1,0,1,0],
[0,0,0,1,1,0],
[0,0,0,0,0,0]])
mask = im == 0
rows = np.flatnonzero((~mask).sum(axis=1))
cols = np.flatnonzero((~mask).sum(axis=0))
crop = im[rows.min():rows.max()+1, cols.min():cols.max()+1]
print crop
Run Code Online (Sandbox Code Playgroud)
让我们稍微分解一下 2D 示例。
In [1]: import numpy as np
In [2]: im = np.array([[0,0,0,0,0,0],
...: [0,0,1,1,1,0],
...: [0,1,1,0,1,0],
...: [0,0,0,1,1,0],
...: [0,0,0,0,0,0]])
Run Code Online (Sandbox Code Playgroud)
好的,现在让我们创建一个满足我们条件的布尔数组:
In [3]: mask = im == 0
In [4]: mask
Out[4]:
array([[ True, True, True, True, True, True],
[ True, True, False, False, False, True],
[ True, False, False, True, False, True],
[ True, True, True, False, False, True],
[ True, True, True, True, True, True]], dtype=bool)
Run Code Online (Sandbox Code Playgroud)
另外,请注意~运算符logical_not在布尔数组上的功能:
In [5]: ~mask
Out[5]:
array([[False, False, False, False, False, False],
[False, False, True, True, True, False],
[False, True, True, False, True, False],
[False, False, False, True, True, False],
[False, False, False, False, False, False]], dtype=bool)
Run Code Online (Sandbox Code Playgroud)
考虑到这一点,要找到所有元素都为假的行,我们可以跨列求和:
In [6]: (~mask).sum(axis=1)
Out[6]: array([0, 3, 3, 2, 0])
Run Code Online (Sandbox Code Playgroud)
如果没有元素为 True,我们将得到 0。
与查找所有元素都为假的列类似,我们可以跨行求和:
In [7]: (~mask).sum(axis=0)
Out[7]: array([0, 1, 2, 2, 3, 0])
Run Code Online (Sandbox Code Playgroud)
现在我们需要做的就是找到第一个和最后一个不为零的。 np.flatnonzero比 容易一点nonzero,在这种情况下:
In [8]: np.flatnonzero((~mask).sum(axis=1))
Out[8]: array([1, 2, 3])
In [9]: np.flatnonzero((~mask).sum(axis=0))
Out[9]: array([1, 2, 3, 4])
Run Code Online (Sandbox Code Playgroud)
然后,您可以根据最小/最大非零元素轻松切出区域:
In [10]: rows = np.flatnonzero((~mask).sum(axis=1))
In [11]: cols = np.flatnonzero((~mask).sum(axis=0))
In [12]: im[rows.min():rows.max()+1, cols.min():cols.max()+1]
Out[12]:
array([[0, 1, 1, 1],
[1, 1, 0, 1],
[0, 0, 1, 1]])
Run Code Online (Sandbox Code Playgroud)