Bor*_*rys 13 numpy scipy scikit-learn scikit-image
我有一个2-d numpy数组如下:
a = np.array([[1,5,9,13],
[2,6,10,14],
[3,7,11,15],
[4,8,12,16]]
Run Code Online (Sandbox Code Playgroud)
我想把它提取成2个2个大小的补丁而不重复这些元素.
答案应完全相同.这可以是三维数组或列表,具有相同的元素顺序如下:
[[[1,5],
[2,6]],
[[3,7],
[4,8]],
[[9,13],
[10,14]],
[[11,15],
[12,16]]]
Run Code Online (Sandbox Code Playgroud)
怎么能轻松做到?
在我的实际问题中,a的大小是(36,72).我不能一个接一个地做.我想要以编程方式完成它.
Ste*_*alt 16
使用scikit-image:
import numpy as np
from skimage.util import view_as_blocks
a = np.array([[1,5,9,13],
[2,6,10,14],
[3,7,11,15],
[4,8,12,16]])
print(view_as_blocks(a, (2, 2)))
Run Code Online (Sandbox Code Playgroud)
您可以组合实现它np.reshape,并np.swapaxes像现在这样-
def extract_blocks(a, blocksize, keep_as_view=False):
M,N = a.shape
b0, b1 = blocksize
if keep_as_view==0:
return a.reshape(M//b0,b0,N//b1,b1).swapaxes(1,2).reshape(-1,b0,b1)
else:
return a.reshape(M//b0,b0,N//b1,b1).swapaxes(1,2)
Run Code Online (Sandbox Code Playgroud)
可以看出,有两种使用方法- keep_as_view标志关闭(默认设置为1)或开启。使用keep_as_view = False,我们将交换后的轴重塑为的最终输出3D,而使用keep_as_view = True,则将其保留为4D,这将是输入数组的视图,因此实际上在运行时是免费的。我们将在以后运行的示例案例中对其进行验证。
样品盒
让我们使用一个示例输入数组,如下所示:
In [94]: a
Out[94]:
array([[2, 2, 6, 1, 3, 6],
[1, 0, 1, 0, 0, 3],
[4, 0, 0, 4, 1, 7],
[3, 2, 4, 7, 2, 4],
[8, 0, 7, 3, 4, 6],
[1, 5, 6, 2, 1, 8]])
Run Code Online (Sandbox Code Playgroud)
现在,让我们使用一些块大小进行测试。让我们使用(2,3)关闭视图标记并打开的块大小-
In [95]: extract_blocks(a, (2,3)) # Blocksize : (2,3)
Out[95]:
array([[[2, 2, 6],
[1, 0, 1]],
[[1, 3, 6],
[0, 0, 3]],
[[4, 0, 0],
[3, 2, 4]],
[[4, 1, 7],
[7, 2, 4]],
[[8, 0, 7],
[1, 5, 6]],
[[3, 4, 6],
[2, 1, 8]]])
In [48]: extract_blocks(a, (2,3), keep_as_view=True)
Out[48]:
array([[[[2, 2, 6],
[1, 0, 1]],
[[1, 3, 6],
[0, 0, 3]]],
[[[4, 0, 0],
[3, 2, 4]],
[[4, 1, 7],
[7, 2, 4]]],
[[[8, 0, 7],
[1, 5, 6]],
[[3, 4, 6],
[2, 1, 8]]]])
Run Code Online (Sandbox Code Playgroud)
验证view与keep_as_view=True
In [20]: np.shares_memory(a, extract_blocks(a, (2,3), keep_as_view=True))
Out[20]: True
Run Code Online (Sandbox Code Playgroud)
让我们检查一下大型阵列的性能,并验证如前所述的几乎免费的运行时声明-
In [42]: a = np.random.rand(2000,3000)
In [43]: %timeit extract_blocks(a, (2,3), keep_as_view=True)
1000000 loops, best of 3: 801 ns per loop
In [44]: %timeit extract_blocks(a, (2,3), keep_as_view=False)
10 loops, best of 3: 29.1 ms per loop
Run Code Online (Sandbox Code Playgroud)
这是一个相当神秘的 numpy one-liner 来生成您的 3-d 数组,result1在此处调用:
In [60]: x
Out[60]:
array([[2, 1, 2, 2, 0, 2, 2, 1, 3, 2],
[3, 1, 2, 1, 0, 1, 2, 3, 1, 0],
[2, 0, 3, 1, 3, 2, 1, 0, 0, 0],
[0, 1, 3, 3, 2, 0, 3, 2, 0, 3],
[0, 1, 0, 3, 1, 3, 0, 0, 0, 2],
[1, 1, 2, 2, 3, 2, 1, 0, 0, 3],
[2, 1, 0, 3, 2, 2, 2, 2, 1, 2],
[0, 3, 3, 3, 1, 0, 2, 0, 2, 1]])
In [61]: result1 = x.reshape(x.shape[0]//2, 2, x.shape[1]//2, 2).swapaxes(1, 2).reshape(-1, 2, 2)
Run Code Online (Sandbox Code Playgroud)
result1 就像一个二维数组的一维数组:
In [68]: result1.shape
Out[68]: (20, 2, 2)
In [69]: result1[0]
Out[69]:
array([[2, 1],
[3, 1]])
In [70]: result1[1]
Out[70]:
array([[2, 2],
[2, 1]])
In [71]: result1[5]
Out[71]:
array([[2, 0],
[0, 1]])
In [72]: result1[-1]
Out[72]:
array([[1, 2],
[2, 1]])
Run Code Online (Sandbox Code Playgroud)
(抱歉,我现在没有时间详细说明它是如何工作的。也许以后……)
这是一个使用嵌套列表推导式的不太神秘的版本。在这种情况下,result2是一个二维 numpy 数组的 python 列表:
In [73]: result2 = [x[2*j:2*j+2, 2*k:2*k+2] for j in range(x.shape[0]//2) for k in range(x.shape[1]//2)]
In [74]: result2[5]
Out[74]:
array([[2, 0],
[0, 1]])
In [75]: result2[-1]
Out[75]:
array([[1, 2],
[2, 1]])
Run Code Online (Sandbox Code Playgroud)