使用 cProfile 分析 numpy 没有给出有用的结果

Pau*_*aul 5 numpy cprofile

这段代码:

import numpy as np
import cProfile

shp = (1000,1000)
a = np.ones(shp)
o = np.zeros(shp)

def main():
    np.divide(a,1,o)
    for i in xrange(20):
        np.multiply(a,2,o)
        np.add(a,1,o)

cProfile.run('main()')
Run Code Online (Sandbox Code Playgroud)

仅打印:

         3 function calls in 0.269 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.269    0.269 <string>:1(<module>)
        1    0.269    0.269    0.269    0.269 testprof.py:8(main)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Prof
iler' objects}
Run Code Online (Sandbox Code Playgroud)

我可以让 cProfile 与 numpy 一起工作来告诉我它对各种np.*调用进行了多少次调用以及在每个调用上花费了多少时间?

编辑

像 hpaulj 建议的那样单独包装每个 numpy 函数太麻烦了,所以我正在尝试这样的东西来临时包装许多或所有感兴趣的函数:

def wrapper(f, fn):
    def ff(*args, **kwargs):
        return f(*args, **kwargs)
    ff.__name__ = fn
    ff.func_name = fn
    return ff

for fn in 'divide add multiply'.split():
    f = getattr(np, fn)
    setattr(np, fn, wrapper(f, fn))
Run Code Online (Sandbox Code Playgroud)

但是 cProfile 仍然将它们全部称为ff

hpa*_*ulj 1

将相关调用包装在Python函数中怎么样?

def mul(*args):
    np.multiply(*args)
def add(*args):
    np.add(*args)

def main():
    np.divide(a,1,o)
    for i in xrange(20):
        mul(a,2,o)
        add(a,1,o)
Run Code Online (Sandbox Code Playgroud)

这基本上就是这个 SO 线程中关于提高分析粒度的想法 - 它分析函数调用,而不是行。

有效的 Cython cProfiling 是否意味着编写许多子函数?