这段代码:
import numpy as np
import cProfile
shp = (1000,1000)
a = np.ones(shp)
o = np.zeros(shp)
def main():
np.divide(a,1,o)
for i in xrange(20):
np.multiply(a,2,o)
np.add(a,1,o)
cProfile.run('main()')
Run Code Online (Sandbox Code Playgroud)
仅打印:
3 function calls in 0.269 seconds
Ordered by: standard name
ncalls tottime percall cumtime percall filename:lineno(function)
1 0.000 0.000 0.269 0.269 <string>:1(<module>)
1 0.269 0.269 0.269 0.269 testprof.py:8(main)
1 0.000 0.000 0.000 0.000 {method 'disable' of '_lsprof.Prof
iler' objects}
Run Code Online (Sandbox Code Playgroud)
我可以让 cProfile 与 numpy 一起工作来告诉我它对各种np.*调用进行了多少次调用以及在每个调用上花费了多少时间?
编辑
像 hpaulj 建议的那样单独包装每个 numpy 函数太麻烦了,所以我正在尝试这样的东西来临时包装许多或所有感兴趣的函数:
def wrapper(f, fn):
def ff(*args, **kwargs):
return f(*args, **kwargs)
ff.__name__ = fn
ff.func_name = fn
return ff
for fn in 'divide add multiply'.split():
f = getattr(np, fn)
setattr(np, fn, wrapper(f, fn))
Run Code Online (Sandbox Code Playgroud)
但是 cProfile 仍然将它们全部称为ff
将相关调用包装在Python函数中怎么样?
def mul(*args):
np.multiply(*args)
def add(*args):
np.add(*args)
def main():
np.divide(a,1,o)
for i in xrange(20):
mul(a,2,o)
add(a,1,o)
Run Code Online (Sandbox Code Playgroud)
这基本上就是这个 SO 线程中关于提高分析粒度的想法 - 它分析函数调用,而不是行。
有效的 Cython cProfiling 是否意味着编写许多子函数?