gpt4 book ai didi

c++ - GTX 970 的 CUDA 设备属性

转载 作者:行者123 更新时间:2023-11-27 22:59:56 26 4
gpt4 key购买 nike

调用时

cudaError_t cuda_error;

int device;
cuda_error = cudaGetDevice(&device);
assert(cudaSuccess == cuda_error);

cudaDeviceProp prop;
cuda_error = cudaGetDeviceProperties(&prop, device);
assert(cudaSuccess == cuda_error);

在 GTX 970 上

  • cuda 驱动程序 6.5.19,
  • 显示驱动程序版本 343.98,
  • Win7 Professional SP1 x64),

编译为

-gencode=arch=compute_52,code="compute_52,sm_52"

我得到以下内存属性:

prop.totalGlobalMem == 0 

prop.sharedMemPerBlock == 49152 (48k).

我预计总内存约为 4GB每个 block 共享内存 96kB,因为 GTX 970 使用 GM204。

我错过了什么吗?

在此先感谢您的支持,
米歇尔

最佳答案

My main concern is (or was) the shared memory per block

SM_52(和 SM_37)设备有 96KB shared memory 每个多处理器(每个 SM)可用,但单个线程 block 只能使用其中的 48KB。因此,报告的每个 block 的共享内存为 48KB 是正确的。

引用上面链接的博客:

"Well, GM204 goes one better, upping that to 96KB of dedicated shared memory per SMM. There’s nothing you really need to change to take advantage of this feature: the maximum shared memory per thread block is still 48KB,"

关于c++ - GTX 970 的 CUDA 设备属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28828430/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com