如何将numpy.linalg.norm应用于矩阵的每一行?

62 python numpy

我有一个2D矩阵,我想采取每行的规范.但是当我numpy.linalg.norm(X)直接使用时,它需要整个矩阵的范数.

我可以通过使用for循环然后取每个行的规范来获取每行的范数X[i],但是因为我有30k行所以需要很长时间.

有什么建议可以找到更快的方法吗?或者是否可以应用于np.linalg.norm矩阵的每一行?

unu*_*tbu 76

请注意,正如perimosocordiae所示,从NumPy 1.9开始,它np.linalg.norm(x, axis=1)是计算L2范数的最快方法.


如果您正在计算L2范数,则可以直接计算它(使用axis=-1参数沿行求和):

np.sum(np.abs(x)**2,axis=-1)**(1./2)
Run Code Online (Sandbox Code Playgroud)

当然,Lp-范数可以类似地计算.

它比快得多np.apply_along_axis,但可能不那么方便:

In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
1000 loops, best of 3: 208 us per loop

In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100000 loops, best of 3: 18.3 us per loop
Run Code Online (Sandbox Code Playgroud)

其他ord形式norm也可以直接计算(具有相似的加速比):

In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x)
1000 loops, best of 3: 203 us per loop

In [54]: %timeit np.sum(abs(x), axis=-1)
100000 loops, best of 3: 10.9 us per loop
Run Code Online (Sandbox Code Playgroud)

  • @Patrick:如果`x`的dtype很复杂,那么它会有所不同.例如,如果`x = np.array([(1 + 1j,2 + 1j)])`那么`np.sum(np.abs(x)**2,轴= -1)**(1./2)`是`数组([2.64575131])`,而`np.sum(x**2,轴= -1)**(1./2)`是`数组([2.20320266 + 1.36165413j]) `. (9认同)
  • 为什么你做np.abs(x)如果你的方格x呢? (6认同)
  • @perimosocordiae [posted](http://stackoverflow.com/a/19794741/1959808)[`numpy.linalg.norm`]的更新(http://docs.scipy.org/doc/numpy/reference/generated /numpy.linalg.norm.html)及其[new](https://github.com/numpy/numpy/pull/3387)`axis`参数是目前最快的方法. (2认同)

per*_*iae 45

由于numpy更新而重新提出旧问题.截至1.9版本,numpy.linalg.norm现在接受一个axis论点.[ 代码,文档 ]

这是镇上最快的方法:

In [10]: x = np.random.random((500,500))

In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
10 loops, best of 3: 21 ms per loop

In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100 loops, best of 3: 2.6 ms per loop

In [13]: %timeit np.linalg.norm(x, axis=1)
1000 loops, best of 3: 1.4 ms per loop
Run Code Online (Sandbox Code Playgroud)

并证明它正在计算同样的事情:

In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2))
Out[14]: True
Run Code Online (Sandbox Code Playgroud)


Nic*_*mer 11

比接受的答案要快得多

numpy.sqrt(numpy.einsum('ij,ij->i', a, a))
Run Code Online (Sandbox Code Playgroud)

记下对数刻度:

在此输入图像描述


重现情节的代码:

import numpy
import perfplot


def sum_sqrt(a):
    return numpy.sqrt(numpy.sum(numpy.abs(a)**2, axis=-1))


def apply_norm_along_axis(a):
    return numpy.apply_along_axis(numpy.linalg.norm, 1, a)


def norm_axis(a):
    return numpy.linalg.norm(a, axis=1)


def einsum_sqrt(a):
    return numpy.sqrt(numpy.einsum('ij,ij->i', a, a))


perfplot.show(
    setup=lambda n: numpy.random.rand(n, 3),
    kernels=[sum_sqrt, apply_norm_along_axis, norm_axis, einsum_sqrt],
    n_range=[2**k for k in range(20)],
    logx=True,
    logy=True,
    xlabel='len(a)'
    )
Run Code Online (Sandbox Code Playgroud)

  • 小心解释那是/做什么? (2认同)

NPE*_*NPE 6

请尝试以下方法:

In [16]: numpy.apply_along_axis(numpy.linalg.norm, 1, a)
Out[16]: array([ 5.38516481,  1.41421356,  5.38516481])
Run Code Online (Sandbox Code Playgroud)

a你的2D数组在哪里.

以上计算了L2规范.对于不同的规范,您可以使用以下内容:

In [22]: numpy.apply_along_axis(lambda row:numpy.linalg.norm(row,ord=1), 1, a)
Out[22]: array([9, 2, 9])
Run Code Online (Sandbox Code Playgroud)