如何切片由numpy.void数字组成的numpy.ndarray?

Spa*_*cey 2 python numpy matrix numpy-broadcasting

所以这是交易:我有一个变量x,它是一个numpy.ndarray。此结构的大小为1000。如果我这样做x[0],则得到numpy.void4个数字的。如果我这样做x[1],那么我会得到另一个numpy.void,也有4个数字,依此类推。

我只想做的是:我想对这个数据结构进行切片,以便提取大小为1000x3的numpy矩阵。

我怎么做?谢谢

hpa*_*ulj 7

听起来像您有一个结构化的数组,类似于以下简单示例:

In [158]: x = np.ones((5,), dtype='i,i,f,f')
In [159]: x
Out[159]: 
array([(1, 1,  1.,  1.), (1, 1,  1.,  1.), (1, 1,  1.,  1.),
       (1, 1,  1.,  1.), (1, 1,  1.,  1.)], 
      dtype=[('f0', '<i4'), ('f1', '<i4'), ('f2', '<f4'), ('f3', '<f4')])
In [160]: x[0]
Out[160]: (1, 1,  1.,  1.)
In [161]: type(x[0])
Out[161]: numpy.void
Run Code Online (Sandbox Code Playgroud)

x[0]是一条记录,显示为元组。您按名称访问字段(而不按“列”索引访问):

In [162]: x['f0']
Out[162]: array([1, 1, 1, 1, 1], dtype=int32)
In [163]: x['f2'] = np.arange(5)

In [165]: x['f1'] = [10,12,8,0,3]
In [166]: x
Out[166]: 
array([(1, 10,  0.,  1.), (1, 12,  1.,  1.), (1,  8,  2.,  1.),
       (1,  0,  3.,  1.), (1,  3,  4.,  1.)], 
      dtype=[('f0', '<i4'), ('f1', '<i4'), ('f2', '<f4'), ('f3', '<f4')])
In [168]: x[['f2','f3']]    # 2 fields at once
Out[168]: 
array([( 0.,  1.), ( 1.,  1.), ( 2.,  1.), ( 3.,  1.), ( 4.,  1.)], 
      dtype=[('f2', '<f4'), ('f3', '<f4')])
Run Code Online (Sandbox Code Playgroud)

当“列”应包含不同的内容(例如,字符串在一个字符串中,整数在另一个字符串中)时,这很方便。但是将这样的数组转换为相同数字类型的2d数组可能很尴尬。

view并且astype可以在有限的情况下使用,但它tolist是我所知道的最可靠的转换媒介。

In [179]: x.tolist()
Out[179]: 
[(1, 10, 0.0, 1.0),
 (1, 12, 1.0, 1.0),
 (1, 8, 2.0, 1.0),
 (1, 0, 3.0, 1.0),
 (1, 3, 4.0, 1.0)]
In [180]: np.array(x.tolist())
Out[180]: 
array([[  1.,  10.,   0.,   1.],
       [  1.,  12.,   1.,   1.],
       [  1.,   8.,   2.,   1.],
       [  1.,   0.,   3.,   1.],
       [  1.,   3.,   4.,   1.]])
Run Code Online (Sandbox Code Playgroud)

请注意,tolist结构化数组的for是元组列表,而tolist2d数组的for是列表列表。朝这个方向发展,差异无所谓。相反,差异很重要。

您是如何生成此数组的?从csvgenfromtxt?作为其他数字包的输出?