gpt4 book ai didi

memory - 合并是否触发以相反的顺序访问内存?

转载 作者:行者123 更新时间:2023-12-01 23:02:43 24 4
gpt4 key购买 nike

假设我有几个线程,它们访问地址 A+0、A+4、A+8、A+12 的内存(每次访问 = 下一个线程)。这种访问是合并的,对吗?

但是,如果我以相反的顺序访问相同的内存,则意味着:

thread 0 -> A+12
thread 1 -> A+8
thread 2 -> A+4
thread 3 -> A+0

这里是否也触发了合并?

最佳答案

是的,对于 cc 2.0 和更新的 GPU,只要所有请求的 32 位数据元素都来自(请求自)相同的 128 字节(和 128 字节),任何随机排列的 32 位数据元素都会发生合并对齐)全局内存中的区域。

GPU 在内存 Controller 中有一个类似于“纵横开关”的东西,可以根据需要分配元素。您可能感兴趣 this GPU webinar它讨论了合并,并将以图形方式说明这个特殊情况(幻灯片 12)。

NVIDIA webinar page还有您可能感兴趣的其他有用的网络研讨会。

对于 cc2.0 之前的设备 the specifics vary by compute capability ,但支持计算 1.0 和 1.1 的设备没有这种能力来合并“反向顺序”或随机顺序的读取。

关于memory - 合并是否触发以相反的顺序访问内存?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15029765/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com