gpt4 book ai didi

c++ - 使用 boost::mpi 的 mpi 中的消息大小是否有限制?

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:40:29 27 4
gpt4 key购买 nike

我目前正在 openMPI 之上使用 boost::mpi 编写模拟,一切运行良好。但是,一旦我扩大系统规模,因此必须发送更大的 std::vectors,我就会出错。

我已将问题简化为以下问题:

#include <boost/mpi.hpp>
#include <boost/mpi/environment.hpp>
#include <boost/mpi/communicator.hpp>
#include <boost/serialization/vector.hpp>
#include <iostream>
#include <vector>
namespace mpi = boost::mpi;

int main() {
mpi::environment env;
mpi::communicator world;

std::vector<char> a;
std::vector<char> b;
if (world.rank() == 0) {
for (size_t i = 1; i < 1E10; i *= 2) {
a.resize(i);
std::cout << "a " << a.size();
world.isend(0, 0, a);
world.recv(0, 0, b);
std::cout << "\tB " << b.size() << std::endl;
}
}
return 0;
}

打印出来:

a 1 B 1
a 2 B 2
a 4 B 4
....
a 16384 B 16384
a 32768 B 32768
a 65536 B 65536
a 131072 B 0
a 262144 B 0
a 524288 B 0
a 1048576 B 0
a 2097152 B 0

我知道 mpi 消息大小有限制,但 65kB 对我来说似乎有点低。有没有办法发送更大的消息?

最佳答案

消息大小的限制与 MPI_Send 相同:INT_MAX

问题是在下一次迭代中调整 vector a 的大小之前,您没有等待 isend 完成。这意味着由于 vector a 中的重新分配,isend 将读取无效数据。请注意,缓冲区 a 是通过引用传递给 boost::mpi 的,因此您不能更改缓冲区 a 直到 isend 操作已完成。

如果您使用 valgrind 运行您的程序,您将在 i = 131072 时立即看到无效读取。

您的程序运行到 65536 字节的原因是,如果消息小于组件 btl_eager_limit,OpenMPI 将直接发送消息。对于 self 组件(发送到自己的进程),这恰好是 128*1024 字节。由于 boost::serializationstd::vector 的大小添加到字节流中,因此一旦使用 eager_limit 就超过了 code>128*1024 = 131072 作为您的输入大小。

要修复您的代码,请保存 boost::mpi::requestisend() 返回的值,然后添加 wait()到循环结束:

#include <boost/mpi.hpp>
#include <boost/mpi/environment.hpp>
#include <boost/mpi/communicator.hpp>
#include <boost/serialization/vector.hpp>
#include <iostream>
#include <vector>
namespace mpi = boost::mpi;

int main() {
mpi::environment env;
mpi::communicator world;

std::vector<char> a;
std::vector<char> b;
if (world.rank() == 0) {
for (size_t i = 1; i < 1E9; i *= 2) {
a.resize(i);
std::cout << "a " << a.size();
mpi::request req = world.isend(0, 0, a);
world.recv(0, 0, b);
std::cout << "\tB " << b.size() << std::endl;
req.wait();
}
}
return 0;
}

关于c++ - 使用 boost::mpi 的 mpi 中的消息大小是否有限制?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27966262/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com