arm*_*ino 5 python arrays numpy slice
我需要从给定的索引切片数组,直到满足某个条件.
>>> a = numpy.zeros((10), dtype='|S1')
>>> a[2] = 'A'
>>> a[4] = 'X'
>>> a[8] = 'B'
>>> a
array(['', '', 'A', '', 'X', '', '', '', 'B', ''], dtype='|S1')
Run Code Online (Sandbox Code Playgroud)
例如,对于上面的数组,我想要一个给定索引的子集,直到两个方向上的第一个非零值.例如,对于索引值2,4,8,结果将是:
['', '', A, ''] # 2
['', X, '', '', ''] # 4
['', '', '', B, ''] # 8
Run Code Online (Sandbox Code Playgroud)
有关使用numpy API执行此操作的最简单方法的任何建议吗?学习python和numpy,会感激任何帮助.谢谢!
如果你设置这样的问题:
import numpy
a = numpy.zeros((10), dtype=str)
a[2] = 'A'
a[4] = 'X'
a[8] = 'B'
Run Code Online (Sandbox Code Playgroud)
您可以轻松获取非空字符串的索引,如下所示:
i = numpy.where(a!='')[0] # array([2, 4, 8])
Run Code Online (Sandbox Code Playgroud)
或者,numpy.argwhere(..)也很好.
然后你可以使用这个数组切片:
out2 = a[:i[1]] # 2 ['' '' 'A' '']
out4 = a[i[0]+1:i[2]] # 4 ['' 'X' '' '' '']
Run Code Online (Sandbox Code Playgroud)
等等
这是一个掩盖数组的工作,numpy.ma有很多用于处理子集的函数.
a = np.zeros((10), dtype=str)
a[2] = 'A'
a[4] = 'X'
a[8] = 'B'
Run Code Online (Sandbox Code Playgroud)
让我们掩盖不是空元素:
am=np.ma.masked_where(a!='', a)
Run Code Online (Sandbox Code Playgroud)
np.ma.notmasked_contiguous 遍历数组(非常有效)并找到数组未被掩盖的所有连续元素切片:
slices = np.ma.notmasked_contiguous(am)
[slice(0, 1, None), slice(3, 3, None), slice(5, 7, None), slice(9, 9, None)]
Run Code Online (Sandbox Code Playgroud)
因此,例如,阵列在元素5和7之间连续地为空.现在你只需加入你感兴趣的切片,首先得到每个切片的起始索引:
slices_start = np.array([s.start for s in slices])
Run Code Online (Sandbox Code Playgroud)
然后你得到你正在寻找的索引的位置:
slices_start.searchsorted(4) #4
Out: 2
Run Code Online (Sandbox Code Playgroud)
所以你想要切片1和2:[slices [1] .start:slices [2] .stop + 1] array(['','X','','',''],dtype ='| S1' )
或者让我们试试8:
i = slices_start.searchsorted(8)
a[slices[i-1].start:slices[i].stop+1]
Out: array(['', '', '', 'B', ''],
dtype='|S1')
Run Code Online (Sandbox Code Playgroud)
如果应该在ipython中使用它可以更好地理解它.