gpt4 book ai didi

opencl - OpenCL 上 __constant 内存的访问性能与 __global 内存相同吗

转载 作者:行者123 更新时间:2023-12-02 03:41:35 35 4
gpt4 key购买 nike

据我所知。 CUDA 上的常量内存是一种特定的内存。而且它比全局内存更快。但在 OpenCL 的规范中。我得到以下的话。

The __constant or constant address space name is used to describe variables allocated in global memory and which are accessed inside a kernel(s) as read-only variables

所以__constant内存来自__global内存。这是否意味着它与__global内存具有相同的访问性能?

最佳答案

这取决于您所使用的 OpenCL 平台的硬件和软件架构。例如,可以设想一种具有不需要参与缓存一致性的只读缓存的体系结构。这些缓存可用于常量内存,但不能用于全局内存。因此,您可能会看到对常量内存的访问速度更快。

话虽这么说,我熟悉的架构都不是以这种方式运行的。所以这只是假设。

关于opencl - OpenCL 上 __constant 内存的访问性能与 __global 内存相同吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12153443/

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com