- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我想通过 CUDA 感知 MPI 在不同 CUDA 设备之间交换数据,如 this article 中所述.据我了解,以下代码应该可以完成这项工作:
#include <mpi.h>
int main( int argc, char *argv[] )
{
int rank;
float *ptr = NULL;
const size_t elements = 32;
MPI_Status status;
MPI_Init( NULL, NULL );
MPI_Comm_rank( MPI_COMM_WORLD, &rank );
cudaMalloc( (void**)&ptr, elements * sizeof(float) );
if( rank == 0 )
MPI_Send( ptr, elements, MPI_FLOAT, 1, 0, MPI_COMM_WORLD );
if( rank == 1 )
MPI_Recv( ptr, elements, MPI_FLOAT, 0, 0, MPI_COMM_WORLD, &status );
cudaFree( ptr );
MPI_Finalize();
return 0;
}
不幸的是,此程序在两个进程上执行时因段错误而崩溃,并显示以下消息:
*** Process received signal ***
Signal: Segmentation fault (11)
Signal code: Address not mapped (1)
Failing at address: 0x210000
[ 0] /lib64/libc.so.6[0x39d94326a0]
[ 1] /lib64/libc.so.6(memcpy+0xd2)[0x39d9489742]
[ 2] /usr/lib64/openmpi/lib/libopen-pal.so.6(opal_convertor_pack+0x18e)[0x2b750326cb1e]
[ 3] /usr/lib64/openmpi/lib/openmpi/mca_btl_smcuda.so(mca_btl_smcuda_sendi+0x3dc)[0x2b7507c2252c]
[ 4] /usr/lib64/openmpi/lib/openmpi/mca_pml_ob1.so(+0x890f)[0x2b75086ec90f]
[ 5] /usr/lib64/openmpi/lib/openmpi/mca_pml_ob1.so(mca_pml_ob1_send+0x499)[0x2b75086ed939]
[ 6] /usr/lib64/openmpi/lib/libmpi.so.1(PMPI_Send+0x1dd)[0x2b7502d3ef8d]
[ 7] prog(main+0x98)[0x400d51]
[ 8] /lib64/libc.so.6(__libc_start_main+0xfd)[0x39d941ed5d]
[ 9] prog[0x400be9]
*** End of error message ***
我使用 OpenMPI 1.8.2 和 nvcc 6.5;据我所知,这些版本应该支持此功能。
所以,我的问题是:我做错了什么?我错过了什么吗?对于如何获得最小工作示例的任何提示,我将不胜感激!
最佳答案
段错误几乎可以肯定是由于将设备指针传递给 MPI,而 MPI 需要主机指针。只有正确构建的 CUDA 感知 MPI 才能接受设备指针。仅仅拥有 OpenMPI 1.8.2 是不够的。您必须具有使用 CUDA 感知设置明确构建的 OpenMPI 版本。
对于 OpenMPI,
开始here
摘录:
支持 CUDA 意味着 MPI 库可以直接发送和接收 GPU 缓冲区。此功能存在于 Open MPI 1.7 系列及更高版本中。支持不断更新,因此不同版本存在不同级别的支持。
Configuring Open MPI 1.7, MPI 1.7.1 and 1.7.2
--with-cuda(=DIR) Build cuda support, optionally adding DIR/include,
DIR/lib, and DIR/lib64
--with-cuda-libdir=DIR Search for cuda libraries in DIR
以下是启用 CUDA 支持的配置命令的一些示例。
在默认位置搜索。在/usr/local/cuda/include 中查找 cuda.h,在/usr/lib64 中查找 libcuda.so。
./configure --with-cuda
在/usr/local/cuda-v4.0/cuda/include 中搜索 cuda.h,在默认位置/usr/lib64 中搜索 libcuda.so。
./configure --with-cuda=/usr/local/cuda-v4.0/cuda
在/usr/local/cuda-v4.0/cuda/include 中搜索 cuda.h,在/usr/lib64 中搜索 libcuda.so。 (与上一个相同)
./configure --with-cuda=/usr/local/cuda-v4.0/cuda --with-cuda-libdir=/usr/lib64
如果找不到 cuda.h 或 libcuda.so 文件,则配置将中止。
注意:Open MPI 1.7.2 中存在一个错误,如果您使用 --enable-static 配置库,将会出现错误。要解决此错误,请将以下内容添加到您的配置行并重新配置。这会禁用基本上未使用的 PML BFO 的构建。此错误已在 Open MPI 1.7.3 中修复。
--enable-mca-no-build=pml-bfo
Configuring Open MPI 1.7.3 and later
使用 Open MPI 1.7.3 及更高版本,libcuda.so 库是动态加载的,因此无需在配置时指定它的路径。因此,您只需要指向 cuda.h 头文件的路径即可。
在默认位置搜索。在/usr/local/cuda/include 中查找 cuda.h。
./configure --with-cuda
在/usr/local/cuda-v5.0/cuda/include 中搜索 cuda.h。
./configure --with-cuda=/usr/local/cuda-v5.0/cuda
请注意,您不能使用 --disable-dlopen
进行配置,因为这会破坏 Open MPI 库动态加载 libcuda.so 的能力。
见
this FAQ entry有关如何使用 CUDA 支持的详细信息。
请注意,这些说明假定您熟悉构建 OpenMPI。仅仅运行 ./configure ...
是不够的,之后还有 make 和 make install 步骤。但上述配置命令是区分 CUDA 感知 OpenMPI 构建与普通构建的区别。
关于c++ - 使用 CUDA-aware MPI 的要求,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27908813/
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 此帖子已于 8 个月
除了调试之外,是否有任何针对 c、c++ 或 c# 的测试工具,其工作原理类似于将独立函数复制粘贴到某个文本框,然后在其他文本框中输入参数? 最佳答案 也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法,例如将分辨率加倍或输入负值,但它永远无法将窗口放在我的第二台显示器上。 关于如何在 C/C++/c# 中执行此操作的任何线索 最
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。 我正在尝试编写一个 C# 程序,它将使用 DES 算法进行加密和解密。我需要一些实
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
有没有办法强制将另一个 窗口置于顶部? 不是应用程序的窗口,而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
假设您可以在 C/C++ 或 Csharp 之间做出选择,并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例,那么构建套接字服务器应用程序的最明智选择是什么? 最佳答案 如
你们能告诉我它们之间的区别吗? 顺便问一下,有什么叫C++库或C库的吗? 最佳答案 C++ 标准库 和 C 标准库 是 C++ 和 C 标准定义的库,提供给 C++ 和 C 程序使用。那是那些词的共同
下面的测试代码,我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端 我想也许我应该使用
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码,但我不想与雇主共享该函数的代码。相反,我只想让他有权在他自己的代码中调用该函数。是否可以?我想到了这两种方法 - 在
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等,
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一些 C 代码,将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6
我是一名优秀的程序员,十分优秀!