使用 cProfile 分析 numpy 没有给出有用的结果

Question

使用 cProfile 分析 numpy 没有给出有用的结果

这段代码：

import numpy as np
import cProfile

shp = (1000,1000)
a = np.ones(shp)
o = np.zeros(shp)

def main():
    np.divide(a,1,o)
    for i in xrange(20):
        np.multiply(a,2,o)
        np.add(a,1,o)

cProfile.run('main()')

Run Code Online (Sandbox Code Playgroud)

仅打印：

         3 function calls in 0.269 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.269    0.269 <string>:1(<module>)
        1    0.269    0.269    0.269    0.269 testprof.py:8(main)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Prof
iler' objects}

Run Code Online (Sandbox Code Playgroud)

我可以让 cProfile 与 numpy 一起工作来告诉我它对各种np.*调用进行了多少次调用以及在每个调用上花费了多少时间？

编辑

像 hpaulj 建议的那样单独包装每个 numpy 函数太麻烦了，所以我正在尝试这样的东西来临时包装许多或所有感兴趣的函数：

def wrapper(f, fn):
    def ff(*args, **kwargs):
        return f(*args, **kwargs)
    ff.__name__ = fn
    ff.func_name = fn
    return ff

for fn in 'divide add multiply'.split():
    f = getattr(np, fn)
    setattr(np, fn, wrapper(f, fn))

Run Code Online (Sandbox Code Playgroud)

但是 cProfile 仍然将它们全部称为ff

Answer 1

hpa*_*ulj 1

将相关调用包装在Python函数中怎么样？

def mul(*args):
    np.multiply(*args)
def add(*args):
    np.add(*args)

def main():
    np.divide(a,1,o)
    for i in xrange(20):
        mul(a,2,o)
        add(a,1,o)

Run Code Online (Sandbox Code Playgroud)

这基本上就是这个 SO 线程中关于提高分析粒度的想法 - 它分析函数调用，而不是行。

有效的 Cython cProfiling 是否意味着编写许多子函数？

归档时间：	12 年，2 月前
查看次数：	1037 次
最近记录：	12 年，2 月前