gpt4 book ai didi

cuda - CUDA 设备功能如何工作?

转载 作者:行者123 更新时间:2023-12-02 21:47:38 25 4
gpt4 key购买 nike

来自内核的 CUDA 设备函数调用(用 __device__ 定义)是否与主机函数类似,即,是否涉及将返回地址压入堆栈并将变量压入堆栈并在返回时检索?

如果是,那么在这种情况下哪个内存用于堆栈? (缓存、共享或全局)

最佳答案

__device__ 函数可以内联,也可以不内联(一般来说,主机函数也是如此)。

如果函数是内联的,则不使用堆栈。

如果函数未内联,则存在堆栈使用。

堆栈是每个线程的堆栈,它位于称为“本地”内存的逻辑空间中,该逻辑空间由线程在与称为“全局”内存的逻辑空间所在的同一物理内存中管理,即-板载GPU DRAM。

关于函数是否内联存在细微差别,您可能需要阅读相关文档 section .

您可以阅读有关本地内存的更多信息 here (向下滚动到本地内存部分)。

关于cuda - CUDA 设备功能如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19251189/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com