我有一个mpi4py程序间歇性挂起。如何跟踪各个流程在做什么?
mpi4py
我可以在不同的终端上运行该程序,例如使用 pdb
pdb
mpiexec -n 4 xterm -e "python -m pdb my_program.py"
但是,如果问题仅通过大量进程(在我的情况下为〜80)表现出来,则将变得很麻烦。另外,很容易捕获异常,pdb但是我需要查看跟踪以找出发生挂起的位置。
python debugging parallel-processing trace mpi4py
debugging ×1
mpi4py ×1
parallel-processing ×1
python ×1
trace ×1