CUDA:如何在指向数组的指针数组上应用 __restrict_

CUDA:如何在指向数组的指针数组上应用 restrict？

转载作者：行者123 更新时间：2023-12-02 02:20:31

27

4

这个使用两个 __restrict__ int 数组的内核编译得很好:

__global__ void kerFoo( int* __restrict__ arr0, int* __restrict__ arr1, int num )
{
    for ( /* Iterate over array */ )
        arr1[i] = arr0[i];  // Copy one to other
}

但是，同样的两个int数组组成一个指针数组编译失败:

__global__ void kerFoo( int* __restrict__ arr[2], int num )
{
    for ( /* Iterate over array */ )
        arr[1][i] = arr[0][i];  // Copy one to other
}

编译器给出的错误是:

error: invalid use of `restrict'

我有一些结构，这些结构由指向数组的指针组成。 (例如，传递给具有 int* arr[16] 的内核的结构。)如何将它们传递给内核并能够在它们上应用 __restrict__？

最佳答案

CUDA C 手册只引用了 __restrict__ 的 C99 定义，没有特殊的 CUDA 特定情况。

因为指示的参数是一个包含两个指针的数组，所以 __restrict__ 的使用对我来说看起来完全有效，编译器没有理由提示恕我直言。我会要求编译器作者验证并可能/可能更正该问题。不过，我会对不同的意见感兴趣。

对@talonmies 的评论:

The whole point of restrict is to tell the compiler that two or more pointer arguments will never overlap in memory.

这不是严格意义上的。 restrict 告诉编译器，所讨论的指针在其生命周期内是唯一可以访问指向对象的指针。请注意，指向的对象只是假定为int 数组。 (事实上，在这种情况下它只是一个int。)由于编译器无法知道数组的大小，因此由程序员来保护数组的边界..

关于CUDA:如何在指向数组的指针数组上应用 __restrict__？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8411849/

27

4

0

文章推荐： cuda - 将 Thrust 设备迭代器转换为原始指针

文章推荐： matlab - 将图像分成不重叠和重叠的 block

c - *指针 = - *指针？
我刚接触 C 语言几周，所以对它还很陌生。我见过这样的事情 * (variable-name) = -* (variable-name) 在讲义中，但它到底会做什么？它会否定所指向的值吗？最佳答案
c - void 指针 = int 指针 = float 指针
我有一个指向内存地址的void 指针。然后，我做 int 指针 = void 指针 float 指针 = void 指针然后，取消引用它们以获取值。 { int x = 25; vo
c++ - 需要将char*(指针)转换为wchar_t*(指针)
我正在与计算机控制的泵进行一些串行端口通信，我用来通信的 createfile 函数需要将 com 端口名称解析为 wchar_t 指针。我也在使用 QT 创建一个表单并获取 com 端口名称作为
C 指针。将大数赋值给 char * 指针
#include "stdio.h" #include "malloc.h" int main() { char*x=(char*)malloc(1024); *(x+2)=3; --
c - int 指针转换为 void 指针，然后转换为 double 指针
#include #include main() { int an_int; void *void_pointer = &an_int; double *double_ptr = void
从 C 中的 3D 指针/数组调用 2D 指针/数组
对于每个时间步长，我都有一个二维矩阵 a[ix][iz]，ix 从 0 到 nx-1 和 iz 从 0 到 nz-1。为了组装所有时间步长的矩阵，我定义了一个长度为 nx*nz*nt 的 3D 指针
c - 释放已分配给 char 指针(字符串)数组的内存。我必须释放每个字符串还是只释放 "main"指针？
我有一个函数，它接受一个指向 char ** 的指针并用字符串填充它(我猜是一个字符串数组)。 *list_of_strings* 在函数内部分配内存。 char * *list_of_strings
c - 使用 malloc 初始化 char 指针 VS 不使用 malloc 直接将字符串赋给 char 指针
我试图了解当涉及到字符和字符串时，内存分配是如何工作的。我知道声明的数组的名称就像指向数组第一个元素的指针，但该数组将驻留在内存的堆栈中。另一方面，当我们想要使用内存堆时，我们使用 malloc，
c# - 通过 P/Ivoke 在 C# 中传递 Struct 指针(主体中带有 char 指针)
我有一个 C 语言的 .DLL 文件。该 DLL 中所有函数所需的主要结构具有以下形式。 typedef struct { char *snsAccessID; char *
javascript使递归数组遍历并更新一些内部值(指针)
我得到了以下数组: let arr = [ { children: [ { children: [], current: tru
C程序输出困惑(指针)
#include int main(void) { int i; int *ptr = (int *) malloc(5 * sizeof(int)); for (i=0;
c程序，指针
我正在编写一个程序，它接受一个三位数整数并将其分成两个整数。 224 将变为 220 和 4。 114 将变为 110 和 4。基本上，您可以使用模数来完成。我写了我认为应该工作的东西，编译器一直说
循环中指向int的C++指针？
好吧，我对 C++ 很陌生，我确定这个问题已经在某个地方得到了回答，而且也很简单，但我似乎找不到答案.... 我有一个自定义数组类，我将其用作练习来尝试了解其工作原理，其定义如下: 标题: class
C++ `this` 指针
1) this 指针与其他指针有何不同？据我了解，指针指向堆中的内存。如果有指向它们的指针，这是否意味着对象总是在堆中构造？ 2)我们可以在 move 构造函数或 move 赋值中窃取this指针吗？
C结构，指针
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: C : pointer to struct in the struct definition 在我的初学者类
复制多维数组(指针)
我有两个指向指针的结构指针 typedef struct Square { ... ... }Square; Square **s1; //Representing 2D array of say,
c变量分配内存，指针
变量在内存中是如何定位的？我有这个代码 int w=1; int x=1; int y=1; int z=1; int main(int argc, char** argv) { printf
c编程语言，指针
#include #include main() { char *q[]={"black","white","red"}; printf("%s",*q+3); getch()
指向类成员的模板函数的C++指针
我在“C”类中有以下函数 class C { template void Func1(int x); template void Func2(int x); }; template void
64位机器上的c++指针
我在64位linux下使用c++，编译器(g++)也是64位的。当我打印某个变量的地址时，例如一个整数，它应该打印一个 64 位整数，但实际上它打印了一个 48 位整数。 int i; cout <<

首页

博学

6Ren·AI

商城

CUDA:如何在指向数组的指针数组上应用 restrict？