使用boost :: mpi,mpi中的消息大小是否有限制?

tik*_*tik 6 c++ mpi openmpi boost-mpi

我目前正在openMPI上使用boost :: mpi编写模拟,一切都很好.然而,一旦我扩大系统,因此必须发送更大的std :: vectors我得到错误.

我已将问题减少到以下问题:

#include <boost/mpi.hpp>
#include <boost/mpi/environment.hpp>
#include <boost/mpi/communicator.hpp>
#include <boost/serialization/vector.hpp>
#include <iostream>
#include <vector>
namespace mpi = boost::mpi;

int main() {
    mpi::environment env;
    mpi::communicator world;

    std::vector<char> a;
    std::vector<char> b;
    if (world.rank() == 0) {
        for (size_t i = 1; i < 1E10; i *= 2) {
            a.resize(i);
            std::cout << "a " << a.size();
            world.isend(0, 0, a);
            world.recv(0, 0, b);
            std::cout << "\tB " << b.size() << std::endl;
        }
    }
    return 0;
}
Run Code Online (Sandbox Code Playgroud)

打印出来:

a 1 B 1
a 2 B 2
a 4 B 4
....
a 16384 B 16384
a 32768 B 32768
a 65536 B 65536
a 131072    B 0
a 262144    B 0
a 524288    B 0
a 1048576   B 0
a 2097152   B 0
Run Code Online (Sandbox Code Playgroud)

我知道mpi消息大小有限,但65kB对我来说似乎有点低.有没有办法发送更大的邮件?

Pat*_*ick 4

MPI_Send消息大小的限制与:相同INT_MAX

问题是您没有等待完成就可以在下一次迭代中isend调整向量大小。a这意味着isend由于向量中的重新分配,将读取无效数据a。请注意,缓冲区a是通过引用传递的,因此在操作完成之前boost::mpi不允许更改缓冲区。aisend

如果您使用 运行程序valgrind,一旦 i = 131072,您就会看到无效读取。

您的程序工作到 65536 字节的原因是,如果消息小于组件,OpenMPI 将直接发送消息btl_eager_limit。对于self组件(发送到自己的进程),这恰好是128*1024字节。由于boost::serialization将 的大小添加std::vector到字节流中,因此eager_limit一旦用作128*1024 = 131072输入大小,您就会超过此大小。

要修复代码,请保存boost::mpi::request返回值isend(),然后将其添加wait()到循环末尾:

#include <boost/mpi.hpp>
#include <boost/mpi/environment.hpp>
#include <boost/mpi/communicator.hpp>
#include <boost/serialization/vector.hpp>
#include <iostream>
#include <vector>
namespace mpi = boost::mpi;

int main() {
    mpi::environment env;
    mpi::communicator world;

    std::vector<char> a;
    std::vector<char> b;
    if (world.rank() == 0) {
        for (size_t i = 1; i < 1E9; i *= 2) {
            a.resize(i);
            std::cout << "a " << a.size();
            mpi::request req = world.isend(0, 0, a);
            world.recv(0, 0, b);
            std::cout << "\tB " << b.size() << std::endl;
            req.wait();
        }
    }
    return 0;
}
Run Code Online (Sandbox Code Playgroud)