Numpy:基于索引数组重新排列数组

hli*_*117 28 python arrays numpy

我正在寻找能够帮助我做到以下几点的单线解决方案.

假设我有

array = np.array([10, 20, 30, 40, 50])
Run Code Online (Sandbox Code Playgroud)

我想根据输入顺序重新排列它.如果调用了numpy函数arrange,它将执行以下操作:

newarray = np.arrange(array, [1, 0, 3, 4, 2])
print newarray

    [20, 10, 40, 50, 30]
Run Code Online (Sandbox Code Playgroud)

形式上,如果要重新排序的数组是mxn,并且"index"数组是1 xn,则排序将由名为"index"的数组确定.

numpy有这样的功能吗?

DSM*_*DSM 37

您可以直接使用"索引"列表,因为索引数组:

>>> arr = np.array([10, 20, 30, 40, 50])
>>> idx = [1, 0, 3, 4, 2]
>>> arr[idx]
array([20, 10, 40, 50, 30])
Run Code Online (Sandbox Code Playgroud)

如果idx已经是a ndarray而不是a list,它往往会快得多,即使它可以以任何方式工作:

>>> %timeit arr[idx]
100000 loops, best of 3: 2.11 µs per loop
>>> ai = np.array(idx)
>>> %timeit arr[ai]
1000000 loops, best of 3: 296 ns per loop
Run Code Online (Sandbox Code Playgroud)

  • 谢谢!如果"索引"是2d数组怎么办?例如,我想通过使用索引`[`[[1,2],["a","b"]`转换为`[[2,1],["a","b"]]` [1,0],[0,1]]`.我知道一个丑陋的方法是使用for循环使用索引数组的相应行重新排列数组的每一行.但是必须有一个更快的方法. (3认同)

小智 9

对于那些有同样困惑的人,我实际上正在寻找稍微不同版本的“根据索引重新排列数组”。在我的情况下,索引数组正在索引目标数组而不是源数组。换句话说,我尝试根据数组在新数组中的位置重新排列数组。

在这种情况下,只需应用argsort索引之前即可。例如

>>> arr = np.array([10, 20, 30, 40, 50])
>>> idx = [1, 0, 3, 4, 2]
>>> arr[np.argsort(idx)]
array([20, 10, 50, 30, 40])
Run Code Online (Sandbox Code Playgroud)

请注意此结果与操作所需结果之间的差异。

可以来回验证

>>> arr[np.argsort(idx)][idx] == arr
array([ True,  True,  True,  True,  True])
>>> arr[idx][np.argsort(idx)] == arr
array([ True,  True,  True,  True,  True])
Run Code Online (Sandbox Code Playgroud)


小智 7

对于那些索引为二维数组的人,您可以使用 map 函数。下面是一个例子:

a = np.random.randn(3, 3)
print(a)
print(np.argsort(a))

print(np.array(list(map(lambda x, y: y[x], np.argsort(a), a))))
Run Code Online (Sandbox Code Playgroud)

输出是

[[-1.42167035  0.62520498  2.02054623]
 [-0.17966393 -0.01561566  0.24480554]
 [ 1.10568543  0.00298402 -0.71397599]]
[[0 1 2]
 [0 1 2]
 [2 1 0]]
[[-1.42167035  0.62520498  2.02054623]
 [-0.17966393 -0.01561566  0.24480554]
 [-0.71397599  0.00298402  1.10568543]]
Run Code Online (Sandbox Code Playgroud)