Python - 切片数组,直到满足某些条件

arm*_*ino 5 python arrays numpy slice

我需要从给定的索引切片数组,直到满足某个条件.

>>> a = numpy.zeros((10), dtype='|S1')
>>> a[2] = 'A'
>>> a[4] = 'X'
>>> a[8] = 'B'
>>> a
array(['', '', 'A', '', 'X', '', '', '', 'B', ''], dtype='|S1')
Run Code Online (Sandbox Code Playgroud)

例如,对于上面的数组,我想要一个给定索引的子集,直到两个方向上的第一个非零值.例如,对于索引值2,4,8,结果将是:

['', '', A, '']      # 2
['', X, '', '', '']  # 4
['', '', '', B, '']  # 8
Run Code Online (Sandbox Code Playgroud)

有关使用numpy API执行此操作的最简单方法的任何建议吗?学习python和numpy,会感激任何帮助.谢谢!

Pau*_*aul 7

如果你设置这样的问题:

import numpy
a = numpy.zeros((10), dtype=str)
a[2] = 'A'
a[4] = 'X'
a[8] = 'B'
Run Code Online (Sandbox Code Playgroud)

您可以轻松获取非空字符串的索引,如下所示:

i = numpy.where(a!='')[0]  # array([2, 4, 8])
Run Code Online (Sandbox Code Playgroud)

或者,numpy.argwhere(..)也很好.

然后你可以使用这个数组切片:

out2 = a[:i[1]]        # 2   ['' '' 'A' '']
out4 = a[i[0]+1:i[2]]  # 4   ['' 'X' '' '' '']
Run Code Online (Sandbox Code Playgroud)

等等


And*_*nca 6

这是一个掩盖数组的工作,numpy.ma有很多用于处理子集的函数.

a = np.zeros((10), dtype=str)
a[2] = 'A'
a[4] = 'X'
a[8] = 'B'
Run Code Online (Sandbox Code Playgroud)

让我们掩盖不是空元素:

am=np.ma.masked_where(a!='', a)
Run Code Online (Sandbox Code Playgroud)

np.ma.notmasked_contiguous 遍历数组(非常有效)并找到数组未被掩盖的所有连续元素切片:

slices = np.ma.notmasked_contiguous(am)
[slice(0, 1, None), slice(3, 3, None), slice(5, 7, None), slice(9, 9, None)]
Run Code Online (Sandbox Code Playgroud)

因此,例如,阵列在元素5和7之间连续地为空.现在你只需加入你感兴趣的切片,首先得到每个切片的起始索引:

slices_start = np.array([s.start for s in slices])
Run Code Online (Sandbox Code Playgroud)

然后你得到你正在寻找的索引的位置:

slices_start.searchsorted(4) #4
Out: 2
Run Code Online (Sandbox Code Playgroud)

所以你想要切片1和2:[slices [1] .start:slices [2] .stop + 1] array(['','X','','',''],dtype ='| S1' )

或者让我们试试8:

i = slices_start.searchsorted(8)
a[slices[i-1].start:slices[i].stop+1]
Out: array(['', '', '', 'B', ''], 
  dtype='|S1')
Run Code Online (Sandbox Code Playgroud)

如果应该在ipython中使用它可以更好地理解它.