gpt4 book ai didi

parallel-processing - 使用交错寻址方法并行减少库冲突

转载 作者:行者123 更新时间:2023-12-03 14:19:04 25 4
gpt4 key购买 nike

我正在阅读 Mark Harris 的关于优化 CUDA 中的并行缩减的演示文稿。这是一张我有问题的幻灯片:

enter image description here

它说这种方法存在银行冲突问题。但为什么?所有线程都在访问位于不同库中的两个连续内存单元。它们都不会同时访问特定的存储单元。

最佳答案

本演示文稿可追溯到 CUDA 的早期,适用于第一代硬件。

该硬件具有排列在 8 个 32 位组中的共享内存。因为共享数组中的每第八个条目都驻留在同一组中,所以在该归约树的多个级别上都存在组冲突。

这个问题在较新的硬件中得到了解决,其中银行的数量扩大到 32,这意味着不会发生这种银行冲突。

关于parallel-processing - 使用交错寻址方法并行减少库冲突,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40728185/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com