如何在numpy中找到数组中连续元素的组？

Question

如何在numpy中找到数组中连续元素的组？

我必须从numpy数组中聚集连续元素.考虑以下示例

    a = [ 0, 47, 48, 49, 50, 97, 98, 99]

Run Code Online (Sandbox Code Playgroud)

输出应该是一个元组列表,如下所示

   [(0),(47, 48, 49, 50),(97, 98, 99)]

Run Code Online (Sandbox Code Playgroud)

这里差别只是一个.元素之间.如果差异也可以指定为限制或硬编码数字,那将是很好的.

非常感谢.

Answer 1

unu*_*tbu 157

def consecutive(data, stepsize=1):
    return np.split(data, np.where(np.diff(data) != stepsize)[0]+1)

a = np.array([0, 47, 48, 49, 50, 97, 98, 99])
consecutive(a)

Run Code Online (Sandbox Code Playgroud)

产量

[array([0]), array([47, 48, 49, 50]), array([97, 98, 99])]

Run Code Online (Sandbox Code Playgroud)

对于查找相同字符串的运行：`partitions = np.where(a[1:] != a[:-1])[0] + 1`（`np.diff` 不适用于字符串） (3认同)
谢谢！如果我们使用np.split（np.r _ [：len（data）]，np.where（np.diff（data）！= stepsize）[0] +1），则会得到连续的索引列表，因此如果数据”是大表的一列，我们可以使用该结果来索引相同的行组。 (2认同)

Answer 2

dka*_*ins 19

这是一个可能有帮助的lil功能:

def group_consecutives(vals, step=1):
    """Return list of consecutive lists of numbers from vals (number list)."""
    run = []
    result = [run]
    expect = None
    for v in vals:
        if (v == expect) or (expect is None):
            run.append(v)
        else:
            run = [v]
            result.append(run)
        expect = v + step
    return result

>>> group_consecutives(a)
[[0], [47, 48, 49, 50], [97, 98, 99]]
>>> group_consecutives(a, step=47)
[[0, 47], [48], [49], [50, 97], [98], [99]]

Run Code Online (Sandbox Code Playgroud)

这不是NumPy解决方案! (5认同)
PS如果你想要元组而不是列表,你可以做`tuple(map(tuple,group_consecutives(a)))` (2认同)

Answer 3

Pau*_*aul 10

(a[1:]-a[:-1])==1 将产生一个布尔数组,False表示运行中断.您也可以使用内置的numpy.grad.

@LukeSkywalker它不起作用.在这种情况下,`a`是一个numpy数组,而不是一个列表,而减号运算符是逐元素的减法. (2认同)

Answer 4

Jož*_* Ws 6

测试一维数组

获取diff不为一的地方

diffs = numpy.diff(array) != 1

Run Code Online (Sandbox Code Playgroud)

获取 diff 的索引，获取第一个维度并对所有维度加一，因为diff与前一个索引进行比较

indexes = numpy.nonzero(diffs)[0] + 1

Run Code Online (Sandbox Code Playgroud)

使用给定索引进行拆分

groups = numpy.split(array, indexes)

Run Code Online (Sandbox Code Playgroud)

Answer 5

fab*_*ioM 5

这是我到目前为止所提出的:不确定是100%正确

import numpy as np
a = np.array([ 0, 47, 48, 49, 50, 97, 98, 99])
print np.split(a, np.cumsum( np.where(a[1:] - a[:-1] > 1) )+1)

Run Code Online (Sandbox Code Playgroud)

收益:

>>>[array([0]), array([47, 48, 49, 50]), array([97, 98, 99])]

Run Code Online (Sandbox Code Playgroud)

反例： a = np.array([ 0, 47, 48, 49, 50, 97, 98, 99, 101, 102, 103, 140, 141]) print(np.split(a, np.cumsum( np .where(a[1:] - a[:-1] > 1) )+1)) 产生 [array([0]), array([47, 48, 49, 50]), array([ 97, 98, 99, 101, 102, 103, 140]), 数组([141]), 数组([], dtype=int64)] (6认同)

归档时间：	14 年，5 月前
查看次数：	31164 次
最近记录：	10 年，11 月前