m 是一个有形状的ndarray(12,21,21),现在我想只拿一个稀疏的切片来形成一个新的2D数组,
sliceid = 0
indx = np.array([0, 2, 4, 6, 8, 10])
Run Code Online (Sandbox Code Playgroud)
所以这sparse_slice就是直观的
sparse_slice = m[sliceid, indx, indx]
Run Code Online (Sandbox Code Playgroud)
但显然上面的操作不起作用,目前我正在使用的是
sparse_slice = m[sliceid,indx,:][:, indx]
Run Code Online (Sandbox Code Playgroud)
为什么第一个"直观"的方式不起作用?并且有一种比我目前的解决方案更紧凑的方式吗?我之前所有的ndarray切片试验都是基于直觉,也许我现在转而阅读一些严肃的手册......
更紧凑的方式是做new = m[0, :12:2, :12:2].这就是numpy docs所谓的"基本索引",意味着你用整数或切片对象切片(即0:12:2).当您使用基本索引时,numpy返回原始数组的视图.例如:
In [3]: a = np.zeros((2, 3, 4))
In [4]: b = a[0, 1, ::2]
In [5]: b
Out[5]: array([ 0., 0.])
In [6]: b[:] = 7
In [7]: a
Out[7]:
array([[[ 0., 0., 0., 0.],
[ 7., 0., 7., 0.],
[ 0., 0., 0., 0.]],
[[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.]]])
Run Code Online (Sandbox Code Playgroud)
在您的"直观"方法中,您正在做的是使用另一个数组索引数组.当您使用另一个数组索引numpy数组时,数组需要具有相同的大小(或者它们需要相互广播,在一秒内更多关于此).在文档中,这称为花式索引或高级索引.例如:
In [10]: a = np.arange(9).reshape(3,3)
In [11]: a
Out[11]:
array([[0, 1, 2],
[3, 4, 5],
[6, 7, 8]])
In [12]: index = np.array([0,1,2])
In [13]: b = a[index, index]
In [14]: b
Out[14]: array([0, 4, 8])
Run Code Online (Sandbox Code Playgroud)
你看到我得到[0,0],[1,1]和[2,2]而不是[0,0],[0,1] ...如果你想要"外部产品"索引索引可以执行以下操作.
In [22]: index1 = np.array([[0,0],[1,1]])
In [23]: index2 = np.array([[0,1],[0,1]])
In [24]: b = a[index1, index2]
In [25]: b
Out[25]:
array([[0, 1],
[3, 4]])
Run Code Online (Sandbox Code Playgroud)
上面有一个简写,如下所示:
In [28]: index = np.array([0,1])
In [29]: index1, index2 = np.ix_(index, index)
In [31]: index1
Out[31]:
array([[0],
[1]])
In [32]: index2
Out[32]: array([[0, 1]])
In [33]: a[index1, index2]
Out[33]:
array([[0, 1],
[3, 4]])
In [34]: a[np.ix_(index, index)]
Out[34]:
array([[0, 1],
[3, 4]])
Run Code Online (Sandbox Code Playgroud)
你会发现,index1是(2, 1)和index2是(1, 2),没有(2, 2).那是因为两个阵列相互广播,你可以在这里阅读更多关于广播的内容.请记住,当您使用花式索引时,您将获得原始数据的副本而不是视图.有时这更好(如果你想保持原始数据不变),有时它只需要更多的内存.更多关于索引的信息.