对如何切割numpy数组感到困惑

Question

对如何切割numpy数组感到困惑

m 是一个有形状的ndarray(12,21,21),现在我想只拿一个稀疏的切片来形成一个新的2D数组,

sliceid = 0
indx    = np.array([0, 2, 4, 6, 8, 10])

Run Code Online (Sandbox Code Playgroud)

所以这sparse_slice就是直观的

sparse_slice = m[sliceid, indx, indx]

Run Code Online (Sandbox Code Playgroud)

但显然上面的操作不起作用,目前我正在使用的是

sparse_slice = m[sliceid,indx,:][:, indx]

Run Code Online (Sandbox Code Playgroud)

为什么第一个"直观"的方式不起作用？并且有一种比我目前的解决方案更紧凑的方式吗？我之前所有的ndarray切片试验都是基于直觉,也许我现在转而阅读一些严肃的手册......

Answer 1

Bi *_*ico 5

更紧凑的方式是做new = m[0, :12:2, :12:2].这就是numpy docs所谓的"基本索引",意味着你用整数或切片对象切片(即0:12:2).当您使用基本索引时,numpy返回原始数组的视图.例如:

In [3]: a = np.zeros((2, 3, 4))

In [4]: b = a[0, 1, ::2]

In [5]: b
Out[5]: array([ 0.,  0.])

In [6]: b[:] = 7

In [7]: a
Out[7]: 
array([[[ 0.,  0.,  0.,  0.],
        [ 7.,  0.,  7.,  0.],
        [ 0.,  0.,  0.,  0.]],

       [[ 0.,  0.,  0.,  0.],
        [ 0.,  0.,  0.,  0.],
        [ 0.,  0.,  0.,  0.]]])

Run Code Online (Sandbox Code Playgroud)

在您的"直观"方法中,您正在做的是使用另一个数组索引数组.当您使用另一个数组索引numpy数组时,数组需要具有相同的大小(或者它们需要相互广播,在一秒内更多关于此).在文档中,这称为花式索引或高级索引.例如:

In [10]: a = np.arange(9).reshape(3,3)

In [11]: a
Out[11]: 
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [12]: index = np.array([0,1,2])

In [13]: b = a[index, index]

In [14]: b
Out[14]: array([0, 4, 8])

Run Code Online (Sandbox Code Playgroud)

你看到我得到[0,0],[1,1]和[2,2]而不是[0,0],[0,1] ...如果你想要"外部产品"索引索引可以执行以下操作.

In [22]: index1 = np.array([[0,0],[1,1]])

In [23]: index2 = np.array([[0,1],[0,1]])

In [24]: b = a[index1, index2]

In [25]: b
Out[25]: 
array([[0, 1],
       [3, 4]])

Run Code Online (Sandbox Code Playgroud)

上面有一个简写,如下所示:

In [28]: index = np.array([0,1])

In [29]: index1, index2 = np.ix_(index, index)

In [31]: index1
Out[31]: 
array([[0],
       [1]])

In [32]: index2
Out[32]: array([[0, 1]])

In [33]: a[index1, index2]
Out[33]: 
array([[0, 1],
       [3, 4]])

In [34]: a[np.ix_(index, index)]
Out[34]: 
array([[0, 1],
       [3, 4]])

Run Code Online (Sandbox Code Playgroud)

你会发现,index1是(2, 1)和index2是(1, 2),没有(2, 2).那是因为两个阵列相互广播,你可以在这里阅读更多关于广播的内容.请记住,当您使用花式索引时,您将获得原始数据的副本而不是视图.有时这更好(如果你想保持原始数据不变),有时它只需要更多的内存.更多关于索引的信息.

归档时间：	13 年，11 月前
查看次数：	3219 次
最近记录：	13 年，11 月前