gpt4 book ai didi

GPU L1 缓存一致性

转载 作者:行者123 更新时间:2023-12-02 17:42:03 26 4
gpt4 key购买 nike

在 OPENCL 和 CUDA 中,有原语,即分别为 barrier() 和 syncthread(),以加强 L1 数据缓存/共享内存的一致性。这是否意味着缓存本身不一致,即没有在硬件中为 L1 缓存实现类似 CPU 的缓存一致性协议(protocol)?

最佳答案

大多数缓存一致性算法都无法针对 GPU 进行扩展。此外,GPU 中的高速缓存一致性会给 GPU 内存系统带来大量流量,这已经成为 GPU 的瓶颈。因此,他们使用简单的逐出技术来保持私有(private)缓存和共享缓存之间的数据一致。简单地说,只要有对全局数据的写入,拥有该数据的缓存行就会被驱逐到共享缓存中。最近介绍了一些技术,但我怀疑它们是否真的在硬件中实现。

关于GPU L1 缓存一致性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19508179/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com