gpt4 book ai didi

c++ - CUDA - 确定共享内存中的银行数量

转载 作者:太空狗 更新时间:2023-10-29 20:04:46 25 4
gpt4 key购买 nike

共享内存被“ strip 化”到银行中。众所周知,这会导致整个银行冲突问题。

问题:但是,您如何确定共享内存中存在多少 个组(“ strip ”)?

(在 NVIDIA“devtalk”论坛上闲逛,似乎每 block 共享内存被“ strip 化”为 16 个存储区。但我们如何知道这一点?暗示这一点的线程已经有几年了。情况有变化吗?是它固定在所有支持 NVIDIA CUDA 的卡上?有没有办法从运行时 API 确定这一点(我在那里没有看到它,例如在 cudaDeviceProp 下)?是有没有在运行时手动确定它的方法?)

最佳答案

正如@RobertHarvey 所说,它已记录在案。编程指南为 compute capability 1.x 指示了 16 个库, 和 32 家银行 compute capability 2.x3.x .因此,您可以根据设备属性中返回的计算能力(主要版本)做出任何决定。

cuda 在线文档的一般链接包含在 info link 中。对于 cuda 标签。

关于c++ - CUDA - 确定共享内存中的银行数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17027161/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com