将记录添加到numpy记录数组中

bob*_*nto 11 python numpy record concatenation

假设我定义了一个记录数组

>>> y=np.zeros(4,dtype=('a4,int32,float64'))
Run Code Online (Sandbox Code Playgroud)

然后我继续填写可用的4条记录.现在我获得了更多数据,比如

>>> c=('a',7,'24.5')
Run Code Online (Sandbox Code Playgroud)

我想将此记录添加到y.我无法想出一个干净的方法来做到这一点.我见过的最好的np.concatenate(),但这需要c变成一个记录阵列本身.是否有任何简单的方法可以将我的元组添加c到其中y?这似乎应该是非常简单和广泛记录的.如果是的话道歉.我找不到它.

HYR*_*YRY 23

您可以使用numpy.append(),但是当您需要将新数据转换为记录数组时:

import numpy as np
y = np.zeros(4,dtype=('a4,int32,float64'))
y = np.append(y, np.array([("0",7,24.5)], dtype=y.dtype))
Run Code Online (Sandbox Code Playgroud)

由于ndarray无法动态更改其大小,因此您需要在要添加一些新数据时复制所有数据.您可以创建一个减少调整大小频率的类:

import numpy as np

class DynamicRecArray(object):
    def __init__(self, dtype):
        self.dtype = np.dtype(dtype)
        self.length = 0
        self.size = 10
        self._data = np.empty(self.size, dtype=self.dtype)

    def __len__(self):
        return self.length

    def append(self, rec):
        if self.length == self.size:
            self.size = int(1.5*self.size)
            self._data = np.resize(self._data, self.size)
        self._data[self.length] = rec
        self.length += 1

    def extend(self, recs):
        for rec in recs:
            self.append(rec)

    @property
    def data(self):
        return self._data[:self.length]

y = DynamicRecArray(('a4,int32,float64'))
y.extend([("xyz", 12, 3.2), ("abc", 100, 0.2)])
y.append(("123", 1000, 0))
print y.data
for i in xrange(100):
    y.append((str(i), i, i+0.1))
Run Code Online (Sandbox Code Playgroud)


Pau*_*aul 5

这是因为通常避免连接numpy数组,因为它需要重新分配连续的内存空间.调整数组大小,留出余地,然后根据需要连接大块. 这篇文章可能会有所帮助.