gpt4 book ai didi

cuda - CUDA 设备功能如何工作?

转载 作者:行者123 更新时间:2023-12-02 04:48:53 24 4
gpt4 key购买 nike

来自内核的 CUDA 设备函数调用(使用 __device__ 定义)是否与主机函数类似,即是否涉及将返回地址压入堆栈并将变量压入堆栈并在返回时检索?

如果是,那么在这种情况下哪个内存用于堆栈? (缓存,共享或全局)

最佳答案

__device__ 函数可以是内联的,也可以不是内联的(一般来说,主机函数也是如此)。

如果函数是内联的,则没有堆栈使用。

如果函数没有被内联,就会有堆栈占用。

堆栈是每个线程的堆栈,它位于称为“本地”内存的逻辑空间中,该内存由位于称为“全局”内存的逻辑空间所在的同一物理内存中的线程管理,即 on -板载 GPU DRAM。

函数是否内联存在细微差别,您可能需要阅读相关文档 section .

您可以阅读有关本地内存的更多信息 here (向下滚动到本地内存部分)。

关于cuda - CUDA 设备功能如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19251189/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com