gpt4 book ai didi

cuda - 以编程方式检索每个多处理器的最大块数

转载 作者:行者123 更新时间:2023-12-02 12:34:22 24 4
gpt4 key购买 nike

有没有办法以编程方式检索多处理器上可以容纳的最大块数?据我所知,如果我想达到每个多处理器的最大块数,那么我需要计算出在不限制 block 数的情况下可以使用多少个线程和多少共享内存。 (哦,还有寄存器的最大数量)

但是,我正在看

http://developer.download.nvidia.com/compute/cuda/4_1/rel/toolkit/docs/online/structcudaDeviceProp.html

而且我没有找到以编程方式检索每个多处理器的最大块数的方法。

有办法做到这一点吗?

最佳答案

据我所知,没有 API 函数可以直接检索该号码。

您可以通过检索计算能力主要版本并使用 the programming guide 中的信息来创建自己的函数。 。如果抄送 1.x 或 2.x,则每个多处理器有 8 个 block 。如果是 cc 3.x,则每个多处理器有 16 个 block 。如果抄送 5.x it's 32 blocks .

这并不能保证你的代码不会过时,但它可能是最好的方法。

关于cuda - 以编程方式检索每个多处理器的最大块数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22520209/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com