OpenCL __constant 与#define-6ren

OpenCL __constant 与#define

转载作者：行者123 更新时间：2023-12-02 17:45:36

在我的 OpenCL 内核中，我有很多控制内存分配、循环迭代次数等的常量。使用全局 __constants 还是 #defines 更快？

最佳答案

与“普通”C 编译器相同的规则适用于 OpenCL 编译器:#define 在实际编译之前用值替换，因此它们被烘焙进入内核。

根据定义，__constant 变量分配在全局内存中，必须在使用前传输。这比使用 #defined 文字要慢。然而，NVIDIA 和 AMD 的 GPU 架构缓存了这些值，并且比普通的全局内存读取速度更快。

故事的结尾和我的个人建议:使用#defines 来获取常量值和“魔数(Magic Number)”，使用__constant 内存来获取更大的快速但只读的内存块(例如查找表)。

关于OpenCL __constant 与#define，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15116521/

OpenCL __constant 与#define
在我的 OpenCL 内核中，我有很多控制内存分配、循环迭代次数等的常量。使用全局 __constants 还是 #defines 更快？最佳答案与“普通”C 编译器相同的规则适用于 OpenCL
OpenCL __constant 与#define
在我的 OpenCL 内核中，我有很多控制内存分配、循环迭代次数等的常量。使用全局 __constants 还是 #defines 更快？最佳答案与“普通”C 编译器相同的规则适用于 OpenCL
OpenCL:__constant 内存和 const __global 内存的区别
我想了解当我创建一个具有只读属性的缓冲区并将其与 __constant 一起使用时有什么区别内核中的地址空间限定符或与 const __global 一起使用地址空间限定符。我已经发现这些并不是我问
global-variables - 为什么程序(全局)范围变量必须是 __constant？
我是 OpenCL 的新手，对这个限制感到非常困惑。例如，如果我想写一个 LCG，我必须使状态字可以修改为 rand()。和 srand() .在 ANSI C 中，我会这样做: /* ANSI C
opencl - OpenCL 上 __constant 内存的访问性能与 __global 内存相同吗
据我所知。 CUDA 上的常量内存是一种特定的内存。而且它比全局内存更快。但在 OpenCL 的规范中。我得到以下的话。 The __constant or constant address spac

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章