c++ - 关于 Open MP 和 cudaSetDevice()-6ren

c++ - 关于 Open MP 和 cudaSetDevice()

转载作者：太空狗更新时间：2023-10-29 23:05:52

25

4

有谁知道 cudaSetDevice 的以下用法是否正确？我想随时在任何主机线程中重复调用在不同设备上创建的资源；有没有办法在 CUDA 中做到这一点？

 cudaSetDevice(0);
 /...create cuda streams and do some memory allocation on gpu.../
 cudaSetDevice(1);
 /...create cuda streams and do some memory allocation on gpu.../
 #pragma omp parallel num_threads(2)
 { 
   int omp_threadID=omp_get_thread_num();
    ....
   if (omp_threadID==0)
   {
    cudaSetDevice(0);
    /...calling streams/memory created on device 0.../
   }
   else
   {
    cudaSetDevice(1);
    /...calling streams/memory created on device 1.../
    }; 
  };

最佳答案

是的，类似的东西应该可以工作。确保您在设备 0 上创建的所有内容仅在 OpenMP 线程 0 中使用，同样适用于设备 1 和线程 1。

您可能还想查看 CUDA OpenMP Sample Code ，它演示了如何使用 OpenMP 线程分别管理单个设备。

关于c++ - 关于 Open MP 和 cudaSetDevice()，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17602855/

25

4

0

文章推荐： c++ - 作者在 GotW #53 中想表达什么？

文章推荐： C++ : Formatting output text to . doc/.docx/.rtf(第 2 部分)

文章推荐： java - 更喜欢非成员非友元函数......在 Java 中？

c - cudaSetDevice() 编号在进程间是否一致？
我想在父进程中调用 cudaGetDeviceCount(&N)，然后创建 N 子进程，每个 GPU 找到一个，并传递给每个进程(通过命令-行)一个唯一的 GPU 编号，因此实际上会有一个(且只有一个
cuda - cudaSetDevice() 对 CUDA 设备的上下文堆栈有什么作用？
假设我有一个与设备 i 关联的事件 CUDA 上下文，我现在调用cudaSetDevice(i) .发生什么了？ : 没有？主上下文替换栈顶？主要上下文被压入堆栈？它实际上似乎是不一致的。我已经
CUDA 驱动程序 API 等效于 cudaSetDevice
运行时 API 函数 cudaSetDevice 的 CUDA 驱动程序 API 等价物是什么？我正在研究驱动程序 API，但找不到等效的函数。我能做的是 cuDeviceGet(&cuDevice
memory - cudaSetDevice() 分配超过 580 MB 的全局内存
我有一个复杂的基于 CUDA 的 Linux 应用程序。它在配备一张 NVIDIA GTX 560 Ti 卡(1 GB 内存)的 i7 机器上运行，使用 Ubuntu 12.04 (x86_64) 和
c++ - 在 cudaStreamSynchronize 之前我需要 cudaSetDevice 吗？
在我的系统中，我同时对多个 GPU 进行编程。我需要调用cudaSetDevice()在调用 cudaStreamSynchronize() 之前? 创建 cudaStream_t 时对象，我在调用
c++ - 关于 Open MP 和 cudaSetDevice()
有谁知道 cudaSetDevice 的以下用法是否正确？我想随时在任何主机线程中重复调用在不同设备上创建的资源；有没有办法在 CUDA 中做到这一点？ cudaSetDevice(0); /..
c++ - 第一个 cudaMalloc(K40 vs K20)的缓慢，即使在 cudaSetDevice 之后
我知道 CUDA 会在第一次 API 调用时进行初始化，但花费的时间太多了。即使在单独的 cudaSetDevice 之后测试程序: 使用以下工具构建的相同程序:CUDA 7.0 (compute_

首页

博学

6Ren·AI

商城

c++ - 关于 Open MP 和 cudaSetDevice()