numpy索引:不应该落后省略号是多余的?

Pau*_*zer 1 python numpy array-indexing

在尝试正确理解numpy索引规则时,我偶然发现了以下内容.我曾经认为索引中的尾随省略号没有做任何事情.琐事不是吗?除此之外,事实并非如此:

Python 3.5.2 (default, Nov 11 2016, 04:18:53) 
[GCC 4.8.5] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import numpy as np
>>> 
>>> D2 = np.arange(4).reshape((2, 2))
>>>
>>> D2[[1, 0]].shape; D2[[1, 0], ...].shape
(2, 2)
(2, 2)
>>> D2[:, [1, 0]].shape; D2[:, [1, 0], ...].shape
(2, 2)
(2, 2)
>>> # so far so expected; now
... 
>>> D2[[[1, 0]]].shape; D2[[[1, 0]], ...].shape
(2, 2)
(1, 2, 2)
>>> # ouch!
...
>>> D2[:, [[1, 0]]].shape; D2[:, [[1, 0]], ...].shape
(2, 1, 2)
(2, 1, 2)
Run Code Online (Sandbox Code Playgroud)

现在,知情人士可以告诉我这是一个错误还是一个功能?如果是后者,理由是什么?

保罗先生,谢谢

hpa*_*ulj 5

显然,对[[1, 0]]指数的解释存在一些模糊性.可能同样的事情在这里讨论:

传递列表时的高级切片而不是numpy中的元组

我将尝试一个不同的阵列,看看它是否使事情变得清晰

In [312]: D2=np.array([[0,0],[1,1],[2,2]])
In [313]: D2
Out[313]: 
array([[0, 0],
       [1, 1],
       [2, 2]])

In [316]: D2[[[1,0,0]]]
Out[316]: 
array([[1, 1],
       [0, 0],
       [0, 0]])
In [317]: _.shape
Out[317]: (3, 2)
Run Code Online (Sandbox Code Playgroud)

的使用:...或使索引列表的阵列,所有把它当作(1,3)索引,并且相应地扩大的结果的尺寸

In [318]: D2[[[1,0,0]],:]
Out[318]: 
array([[[1, 1],
        [0, 0],
        [0, 0]]])
In [319]: _.shape
Out[319]: (1, 3, 2)
In [320]: D2[np.array([[1,0,0]])]
Out[320]: 
array([[[1, 1],
        [0, 0],
        [0, 0]]])
In [321]: _.shape
Out[321]: (1, 3, 2)
Run Code Online (Sandbox Code Playgroud)

请注意,如果我将转置应用于索引数组,我会得到(3,1,2)结果

In [323]: D2[np.array([[1,0,0]]).T,:]
...
In [324]: _.shape
Out[324]: (3, 1, 2)
Run Code Online (Sandbox Code Playgroud)

没有:...,它似乎[]在将其应用于第一轴之前剥离一层:

In [330]: D2[[1,0,0]].shape
Out[330]: (3, 2)
In [331]: D2[[[1,0,0]]].shape
Out[331]: (3, 2)
In [333]: D2[[[[1,0,0]]]].shape
Out[333]: (1, 3, 2)
In [334]: D2[[[[[1,0,0]]]]].shape
Out[334]: (1, 1, 3, 2)
In [335]: D2[np.array([[[[1,0,0]]]])].shape
Out[335]: (1, 1, 1, 3, 2)
Run Code Online (Sandbox Code Playgroud)

我认为这里存在向后兼容性问题.我们知道元组层是"冗余的":与之D2[(1,2)]相同D2[1,2].但是对于numpy(numeric)的早期版本的兼容性,[]可以以相同的方式处理第一层.

在那个11月的问题中,我注意到:

因此,在顶层,列表和元组的处理方式相同 - 如果列表不能解释为高级索引列表.

添加的...是分离的另一种方式D2[[[0,1]]]D2[([0,1],)].

@eric/s拉请求seburg解释

 元组规范化是一个相当小的事情(它基本上检查长度为<= np.MAXDIMS的非数组序列,如果它包含另一个序列,slice或None,则将其视为元组).

[[1,2]]是一个带有列表的1元素列表,因此它被认为是一个元组,即([1,2],). [[1,2]],...已经是元组了.

  • _"你有没有任何建议,比如解析一个被截获的索引,比如一个getitem的重新实现,而不必担心错过另一个角落的案例"_ - 这里有一些补丁的讨论[这里]( https://github.com/numpy/numpy/pull/8276) (2认同)