计算在numpy数组中长度变化的值的连续出现次数

Question

计算在numpy数组中长度变化的值的连续出现次数

假设我在numpy数组中有一堆数字,我根据返回布尔数组的条件测试它们:

np.random.seed(3456)
a = np.random.rand(8)
condition = a>0.5

Run Code Online (Sandbox Code Playgroud)

有了这个布尔数组,我想计算连续出现的True的所有长度.例如,如果我有,[True,True,True,False,False,True,True,False,True]我想要回来[3,2,1].

我可以使用此代码执行此操作:

length,count = [],0
for i in range(len(condition)):

    if condition[i]==True:
        count += 1
    elif condition[i]==False and count>0:
        length.append(count)
        count = 0

    if i==len(condition)-1 and count>0:
        length.append(count)

    print length

Run Code Online (Sandbox Code Playgroud)

但是,是否有任何已经实现的功能或python,numpy,scipy等函数计算给定输入的列表或数组中连续出现的长度？

Answer 1

Jai*_*ime 17

如果你已经有一个numpy数组,这可能会更快:

>>> condition = np.array([True,True,True,False,False,True,True,False,True])
>>> np.diff(np.where(np.concatenate(([condition[0]],
                                     condition[:-1] != condition[1:],
                                     [True])))[0])[::2]
array([3, 2, 1])

Run Code Online (Sandbox Code Playgroud)

它检测块开始的位置,具有第一个和最后一个块的逻辑,并简单地计算块启动之间的差异和丢弃与False块相对应的长度.

Answer 2

usu*_* me 14

这是一个使用的解决方案itertools(它可能不是最快的解决方案):

import itertools
condition = [True,True,True,False,False,True,True,False,True]
[ sum( 1 for _ in group ) for key, group in itertools.groupby( condition ) if key ]

Out:
[3, 2, 1]

Run Code Online (Sandbox Code Playgroud)

归档时间：	11 年，11 月前
查看次数：	8165 次
最近记录：	8 年，3 月前