- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
据我所知。 CUDA 上的常量内存是一种特定的内存。而且它比全局内存更快。但在 OpenCL 的规范中。我得到以下的话。
The
__constant
or constant address space name is used to describe variables allocated in global memory and which are accessed inside a kernel(s) as read-only variables
所以__constant
内存来自__global
内存。这是否意味着它与__global
内存具有相同的访问性能?
最佳答案
这取决于您所使用的 OpenCL 平台的硬件和软件架构。例如,可以设想一种具有不需要参与缓存一致性的只读缓存的体系结构。这些缓存可用于常量内存,但不能用于全局内存。因此,您可能会看到对常量内存的访问速度更快。
话虽这么说,我熟悉的架构都不是以这种方式运行的。所以这只是假设。
关于opencl - OpenCL 上 __constant 内存的访问性能与 __global 内存相同吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12153443/
在我的 OpenCL 内核中,我有很多控制内存分配、循环迭代次数等的常量。使用全局 __constants 还是 #defines 更快? 最佳答案 与“普通”C 编译器相同的规则适用于 OpenCL
在我的 OpenCL 内核中,我有很多控制内存分配、循环迭代次数等的常量。使用全局 __constants 还是 #defines 更快? 最佳答案 与“普通”C 编译器相同的规则适用于 OpenCL
我想了解当我创建一个具有只读属性的缓冲区并将其与 __constant 一起使用时有什么区别内核中的地址空间限定符或与 const __global 一起使用地址空间限定符。 我已经发现这些并不是我问
我是 OpenCL 的新手,对这个限制感到非常困惑。例如,如果我想写一个 LCG,我必须使状态字可以修改为 rand()。和 srand() .在 ANSI C 中,我会这样做: /* ANSI C
据我所知。 CUDA 上的常量内存是一种特定的内存。而且它比全局内存更快。但在 OpenCL 的规范中。我得到以下的话。 The __constant or constant address spac
我是一名优秀的程序员,十分优秀!