计算矩阵中出现的行数(numpy)

Nuc*_*lar 6 python numpy

有没有更好的方法来计算给定行在numpy 2D数组中出现的次数

def get_count(array_2d, row):
    count = 0
    # iterate over rows, compare
    for r in array_2d[:,]:
        if np.equal(r, row).all():
            count += 1
    return count    

# let's make sure it works

array_2d = np.array([[1,2], [3,4]])
row = np.array([1,2])       

count = get_count(array_2d, row)
assert(count == 1)
Run Code Online (Sandbox Code Playgroud)

Div*_*kar 3

一种简单的方法是broadcasting-

\n\n
(array_2d == row).all(-1).sum()\n
Run Code Online (Sandbox Code Playgroud)\n\n
\n\n

考虑到内存效率,这是一种方法,将每一行视为网格array_2d上的索引元组n-dimensional并假设输入中为正数 -

\n\n
dims = np.maximum(array_2d.max(0),row) + 1\narray_1d = np.ravel_multi_index(array_2d.T,dims)\nrow_scalar = np.ravel_multi_index(row,dims)\ncount = (array_1d==row_scalar).sum()\n
Run Code Online (Sandbox Code Playgroud)\n\n

是一篇讨论与之相关的各个方面的帖子。

\n\n

注意:使用np.count_nonzero来计算布尔值而不是求和可能会快得多.sum()。因此,请考虑将它用于上述两种方法。

\n\n

这是一个快速运行时测试 -

\n\n
In [74]: arr = np.random.rand(10000)>0.5\n\nIn [75]: %timeit arr.sum()\n10000 loops, best of 3: 29.6 \xc2\xb5s per loop\n\nIn [76]: %timeit np.count_nonzero(arr)\n1000000 loops, best of 3: 1.21 \xc2\xb5s per loop\n
Run Code Online (Sandbox Code Playgroud)\n