小编Par*_*ram的帖子

MPICH/OpenMPI中的容错

我有两个问题 -

Q1.除了检查点/回滚之外,是否有更有效的方法来处理MPI中的错误情况?我看到如果节点"死",程序会突然停止.在节点死后,有没有办法继续执行?(如果以准确性为代价则没有问题)

Q2.我在"http://stackoverflow.com/questions/144309/what-is-the-best-mpi-implementation"中读到,OpenMPI具有更好的容错能力,最近MPICH-2也提出了类似的功能.谁知道它们是什么以及如何使用它们?这是一种"模式"吗?他们可以帮助解决第一季度的情况吗?

亲切的回复.谢谢.

fault-tolerance mpi openmpi mpich

10
推荐指数
1
解决办法
2368
查看次数

建议一个基准程序来比较MPICH和OpenMPI

我是HPC的新手,手头的任务是在集群上对MPICH和OpenMPI进行性能分析和比较,该集群包含运行在ClusterVisionOS上的配备双核AMD Opteron处理器的IBM服务器.

我应该选择哪个基准程序来比较MPICH和OpenMPI实现?

我不确定High-Performance Linpack Benchmark是否可以提供帮助,因为我并没有尝试衡量集群本身的性能..请建议..

谢谢

benchmarking mpi openmpi mpich

8
推荐指数
1
解决办法
4672
查看次数

标签 统计

mpi ×2

mpich ×2

openmpi ×2

benchmarking ×1

fault-tolerance ×1