gpt4 book ai didi

architecture - AMD 设备上的物理内存 : local vs private

转载 作者:行者123 更新时间:2023-12-04 08:37:11 24 4
gpt4 key购买 nike

我在 OpenCL 中编写了一个算法,我需要每个工作单元记住相当一部分数据,比如 long[70] 之间的内容。和 long[200]大约每个内核。

最近的 AMD 设备有 32 KiB __local内存,(对于每个内核的给定数据量)足以存储 20-58 个工作单元的信息。但是,根据我对架构的了解(尤其是从 this drawing ),每个着色器核心也有专用数量的私有(private)内存。但是我找不到它的大小。

谁能告诉我如何找出每个内核有多少私有(private)内存?

我对 HD7970 特别好奇,因为我打算很快购买其中的一些。

编辑:问题解决了,答案是here在附录 D。

最佳答案

答案是由用户 talonmies 在评论中给出的,所以我会在这里写一个新的答案来结束这个问题。

这些值可以在 AMD APP OpenCL 编程指南 http://developer.amd.com/sdks/amdappsdk/assets/amd_accelerated_parallel_processing_opencl_programming_guide.pdf 的附录 D 中找到。 (nVidia 也有类似的文档)。显然,对于 AMD 设备来说,一个寄存器是 128 位 (4x32),而对于所有现代高端设备来说,有 16384 个寄存器,所以每个计算单元有 256KB,这是非常了不起的。

关于architecture - AMD 设备上的物理内存 : local vs private,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9331696/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com