cuda - atomicAdd()用于在GPU上加倍-6ren

cuda - atomicAdd()用于在GPU上加倍

转载作者：行者123 更新时间：2023-12-04 07:04:25

30

4

我正在GPU上做一个项目，我必须使用atomicAdd()来实现两倍，因为cuda不支持它来实现两倍，因此我使用了NVIDIA提供的以下代码。

__device__ double atomicAdd(double* address, double val)
{
    unsigned long long int* address_as_ull =
                                          (unsigned long long int*)address;
    unsigned long long int old = *address_as_ull, assumed;
    do {
        assumed = old;
        old = atomicCAS(address_as_ull, assumed, 
                        __double_as_longlong(val + 
                        __longlong_as_double(assumed)));
    } while (assumed != old);
    return __longlong_as_double(old);
}

现在我想知道为什么该工具需要一个循环，而(假定!=旧)

最佳答案

基本上是因为实现需要负载，而这不能自动执行。比较和交换操作是的原子版本

(*address == assumed) ? (assumed + val) : *address

无法保证 *address上的值在从 *address加载值的周期与 atomicCAS调用用于存储更新值的周期之间不会改变。如果发生这种情况， *address的值将不会更新。因此，循环确保重复执行这两个操作，直到读取操作与比较交换操作之间的 *address处的值没有变化为止，这意味着已进行了更新。

关于cuda - atomicAdd()用于在GPU上加倍，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16077464/

30

4

0

文章推荐： video-streaming - 检测MPEG TS流中的视频帧类型

文章推荐： ruby-on-rails-4 - 为什么设计生成这种格式的确认 URL？

文章推荐： amazon-dynamodb - DynamoDB 查询二级索引，如何定义索引

cuda - atomicAdd()用于在GPU上加倍
我正在GPU上做一个项目，我必须使用atomicAdd()来实现两倍，因为cuda不支持它来实现两倍，因此我使用了NVIDIA提供的以下代码。 __device__ double atomicAdd(
CUDA atomicAdd() 产生错误的结果
我是 CUDA 新手，第一次使用 CUDA 内核。我有以下实现卷积的内核(非常天真)，带有一个虚拟循环，它在全局内存中对同一元素执行 1000 次计算(见下文)。问题是，运算后，结果矩阵中的某些单元
CUDA - atomicAdd(float) 不会添加非常小的值
当我使用 float atomicAdd(float *address, float val) 时添加一个小于约的浮点值。 1e-39至 0 ，加法不起作用，值在address保持为 0。这是最简单
c - atomicAdd 导致错误无法启动/执行内核
我有以下 CUDA C 代码: int i = threadIdx.x + blockIdx.x*blockDim.x; int stride = blockDim.x*gridDim.x; w
用于 double 定义错误的 CUDA atomicAdd
在以前的 CUDA 版本中，atomicAdd 没有为 doubles 实现，所以实现这个很常见，比如 here .使用新的 CUDA 8 RC，当我尝试编译包含此类函数的代码时遇到了麻烦。我想这是因
c++ - 即使在初始化结果参数后，CUDA atomicAdd 也会产生错误的结果
atomicAdd 产生错误的结果。我什至在设备中初始化了结果，但仍然无法正常工作。这是为什么？这是我调用的函数: __global__ void getHammingDistance(char *
c++ - 用于 int3 的 Cuda AtomicAdd
在 Cuda 中，double 的 AtomicAdd 可以使用 while 循环和 AtomicCAS 操作来实现。但是我怎样才能有效地为类型 int3 实现原子添加呢？最佳答案经过进一步考虑，
c++ - CUDA 中的 64 位 atomicAdd
我在使用 atomicAdd 时遇到问题在 CUDA 7 下。atomicAdd为“int”、“unsigned int”和“unsigned long long int”定义，声明它使用“32 位或
c++ - 如何将 atomicAdd 应用于 CUDA 中数组的每个元素？
我有一个代码从 CUDA 示例到 atomicAdd 单个变量 __global__ void myadd(int *data) { unsigned int x = blockIdx.x;
c - 尽管 atomicAdd 函数 (CUDA) 存在竞争条件？
我有一个在两个层面上并行的问题:我有大量的 (x0, x1, y0, y1) 坐标对，它们被转换成变量 vdx， vdy, vyy 并且对于这些集合中的每一个，我都试图计算由它们组成的所有“单项式”的
带有 long long int 的 CUDA atomicAdd()
任何时候我尝试使用 atomicAdd除了 (*int, int) 之外的任何东西我收到此错误: error: no instance of overloaded function "atomicAd
cuda - 错误: function "atomicAdd(double *, double)" has already been defined
我在尝试编译 caffe 衍生物时收到此错误 DeepLab_v2在带有 Cuda 8.0 的 Ubuntu 14.04.5 上。有人知道如何解决这个问题吗？ DeepLab_v2 在另一台装有 C
c++ - 中型网格(>760 x 760)上嵌套循环中 atomicadd 的 CUDA 问题
我的 CUDA 程序中出现未知错误，它似乎与 atomicadd 函数有关。我在 Visual Studio 2015 上的 Windows 上进行编码。我的调用函数指定如下 int regionWi
visual-studio-2010 - Fermi GPU 错误 : identifier "atomicAdd" is undefined under visual studio 2010 & cuda 4. 2
我试图在 Visual Studio 2010 下用 CUDA 4.2 编译一些 CUDA 代码(我使用 Parallel Nsight 2.2 创建了这个 CUDA 项目)，但我遇到了一个原子问题“

首页

博学

6Ren·AI

商城

cuda - atomicAdd()用于在GPU上加倍