多个 gpu 的 cudaDeviceReset-6ren

多个 gpu 的 cudaDeviceReset

转载作者：行者123 更新时间：2023-12-04 07:27:57

26

4

我目前正在使用具有 4 个 Tesla T10 gpu 的 gpu 服务器。当我不断测试内核并且不得不经常使用 ctrl-C 终止进程时，我在一个简单的设备查询代码的末尾添加了几行。代码如下:

#include <stdio.h>

 // Print device properties
 void printDevProp(cudaDeviceProp devProp)
{
    printf("Major revision number:         %d\n",  devProp.major);
    printf("Minor revision number:         %d\n",  devProp.minor);
    printf("Name:                          %s\n",  devProp.name);
    printf("Total global memory:           %u\n",  devProp.totalGlobalMem);
    printf("Total shared memory per block: %u\n",  devProp.sharedMemPerBlock);
    printf("Total registers per block:     %d\n",  devProp.regsPerBlock);
    printf("Warp size:                     %d\n",  devProp.warpSize);
    printf("Maximum memory pitch:          %u\n",  devProp.memPitch);
    printf("Maximum threads per block:     %d\n",  devProp.maxThreadsPerBlock);
    for (int i = 0; i < 3; ++i)
    printf("Maximum dimension %d of block:  %d\n", i, devProp.maxThreadsDim[i]);
    for (int i = 0; i < 3; ++i)
    printf("Maximum dimension %d of grid:   %d\n", i, devProp.maxGridSize[i]);
    printf("Clock rate:                    %d\n",  devProp.clockRate);
    printf("Total constant memory:         %u\n",  devProp.totalConstMem);
    printf("Texture alignment:             %u\n",  devProp.textureAlignment);
    printf("Concurrent copy and execution: %s\n",  (devProp.deviceOverlap ? "Yes" : "No"));
    printf("Number of multiprocessors:     %d\n",  devProp.multiProcessorCount);
    printf("Kernel execution timeout:      %s\n",  (devProp.kernelExecTimeoutEnabled ? "Yes" : "No"));
    return;
}

 int main()
{
    // Number of CUDA devices
    int devCount;
    cudaGetDeviceCount(&devCount);
    printf("CUDA Device Query...\n");
    printf("There are %d CUDA devices.\n", devCount);

    // Iterate through devices
    for (int i = 0; i < devCount; ++i)
    {
        // Get device properties
        printf("\nCUDA Device #%d\n", i);
        cudaDeviceProp devProp;
        cudaGetDeviceProperties(&devProp, i);
        printDevProp(devProp);
    }

    printf("\nPress any key to exit...");
    char c;
    scanf("%c", &c);

    **for (int i = 0; i < devCount; i++) {
        cudaSetDevice(i);
        cudaDeviceReset();
    }**

    return 0;
}

我的查询与 main() 结束之前的 for 循环有关，我在其中一个接一个地设置每个设备，然后使用 cudaResetDevice 命令。我有一种奇怪的感觉，这段代码虽然没有产生任何错误，但我无法重置所有设备。相反，程序每次仅重置默认设备，即设备 0。谁能告诉我我应该怎么做才能重置 4 个设备中的每一个。

谢谢

最佳答案

看起来您可以向 GPU 程序添加一个函数来捕获 ctrl+c 信号 (SIGINT) 并为程序使用的每个设备调用 cudaDeviceReset() 函数。

可以在此处找到在捕获 SIGINT 时调用函数的示例代码:

https://stackoverflow.com/a/482725

为您编写的每个 GPU 程序都包含这样的代码似乎是一个好习惯，我也会这样做:-)

我没有时间写出完整详细的答案，所以请阅读其他答案及其评论。

关于多个 gpu 的 cudaDeviceReset，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7144195/

26

4

0

文章推荐： expressionengine - expresso 商店修饰符

文章推荐： r - 管道传输时到函数内控制台的消息顺序

文章推荐： flutter - 为什么我的 CupertinoActionSheet 从顶部出现？

cuda - cudaDeviceReset()在cuda中的作用是什么
#include "cuda_runtime.h" #include "device_launch_parameters.h" #include __global__ void funct(void
多个 gpu 的 cudaDeviceReset
我目前正在使用具有 4 个 Tesla T10 gpu 的 gpu 服务器。当我不断测试内核并且不得不经常使用 ctrl-C 终止进程时，我在一个简单的设备查询代码的末尾添加了几行。代码如下: #in
c++ - CUDA 推力库和 cudaDeviceReset()
当您调用 cudaDeviceReset() 时，是否会使范围内的任何 thrust::device_vectors 不可用？ thrust::host_vector h_intVec; thrust
c++ - CUDA 流破坏和 CudaDeviceReset
我已经使用 CUDA 流实现了以下类 class CudaStreams { private: int nStreams_; cudaS
c++ - cudaDeviceReset 诉 cudaFree
关于 cudaDeviceReset() 的正确使用存在各种问题，但我无法找到以下问题的答案。 cudaDeviceReset() 上的文档说它明确销毁并清除当前进程中与当前设备关联的所有资源。假设
c++ - CUDA Visual Profiler 5.0 不生成时间线，Cudadevicereset() 出错
我使用 CUDA Visual Profiler 分析我的 CUDA 项目，但它显示消息 "Unable to read the entire session timeline. the displa

首页

博学

6Ren·AI

商城

多个 gpu 的 cudaDeviceReset