gpt4 book ai didi

CUDA共享内存

转载 作者:行者123 更新时间:2023-12-02 11:16:14 26 4
gpt4 key购买 nike

我需要了解一些有关 CUDA 共享内存的信息。假设我在 G80 卡中分配了 50 个 block ,每个 block 有 10 个线程。 G80 的每个 SM 处理器可以同时处理 8 个 block 。假设经过一些计算后,共享内存已被完全占用。

当接下来的 8 个新 block 到达时,共享内存中的值是什么?以前的值会驻留在那里吗?或者将先前的值复制到全局内存并刷新接下来的 8 个 block 的共享内存?

最佳答案

它声明了类型限定符:

  1. 线程寄存器中的变量,仅保留在内核中
  2. 线程全局内存中的变量,仅保留在内核中
  3. __device__ __shared__ block 共享内存中的类型变量,仅保留在内核中
  4. __device__ 网格全局内存中的类型变量,一直保留到应用程序退出
  5. __device__ __constant__ 网格的类型变量,一直保留到应用程序退出

因此,根据此引用文献,您的问题的答案是,如果接下来的 8 个 block 驻留在设备的共享内存中,则应该刷新内存。

关于CUDA共享内存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5032505/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com