F.N*_*N.B 3 python parallel-processing profiler mpi4py
我有一个名为 main_parallel.py的python脚本mpi4py。我可以使用time表单来测量时间,cli但是,如何制作类似于 cProfile 的配置文件?我喜欢看到代码每个部分的调用次数。我不能使用 cProfile 因为它仅用于串行代码。
谢谢!
为什么不能使用cprofile?你有没有尝试过?
对于 MPICH,我是这样运行的:
$ mpiexec -l -np 4 python -m cProfile ./simple-io.py doodad
Run Code Online (Sandbox Code Playgroud)
这给了我 4 组输出,但“-l”参数在每一位输出前面列出了 MPI 等级。注意:“-l”参数是 MPICH 特定的。OpenMPI 使用--tag-output. 其他实现可能会使用其他东西。
我看到 cprofile 可以采用文件名参数。制作每个等级的输出文件,然后使用统计信息对其进行处理
% python
Python 2.7.10 (default, Oct 14 2015, 16:09:02)
[GCC 5.2.1 20151010] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import pstats
>>> pstats.Stats("simple-io.cprofile").sort_stats('cumulative').print_stats()
Run Code Online (Sandbox Code Playgroud)
给了我很多 cprofile 信息...但是我的玩具程序太小了,无法给我任何有用的东西。
小智 5
正如Rob Latham所说,您可以使用 cProfile。您可以将每个进程的输出保存在不同的文件中。如果你想分析一个函数,你可以使用这样的装饰器:
from mpi4py import MPI
import cProfile
def profile(filename=None, comm=MPI.COMM_WORLD):
def prof_decorator(f):
def wrap_f(*args, **kwargs):
pr = cProfile.Profile()
pr.enable()
result = f(*args, **kwargs)
pr.disable()
if filename is None:
pr.print_stats()
else:
filename_r = filename + ".{}".format(comm.rank)
pr.dump_stats(filename_r)
return result
return wrap_f
return prof_decorator
@profile(filename="profile_out")
def my_function():
# do something
Run Code Online (Sandbox Code Playgroud)
每个进程的输出可以使用snakeviz可视化