gpt4 book ai didi

c - OpenACC:如何从指向主机上相应数组的指针选择设备上的数组

转载 作者:行者123 更新时间:2023-11-30 14:32:55 26 4
gpt4 key购买 nike

我正在尝试使用 OpenACC 将现有 C 代码卸载到 GPU。在原始的CPU代码中,很多时候需要根据某个参数的值来选择一个数据数组。下面给出了示例 CPU 代码:

#include <stdio.h>
#include <stdlib.h>


void selectArray (int **F, int a);

#define NN 1000
int *C, *D, *E;

int main(void)
{
int *F, a = 10; // a is the parameter used to select the array

C = (int *)malloc(NN * sizeof(int));
D = (int *)malloc(NN * sizeof(int));
E = (int *)malloc(NN * sizeof(int));

for (int i = 0; i < NN; i++)
{
C[i] = 10;
D[i] = 20;
}

selectArray(&F, a);

for (int i = 0; i < NN; i++)
{
E[i] = 2 * F[i];
}

for (int i = 0; i < 200; i++)
printf("%d %d \n", i, E[i]);

return 0;

}

void selectArray(int **F, int a)
{
if (a <= 15)
{
(*F) = C;
}
else
{
(*F) = D;
}
}

对于 OpenACC 版本的代码,数组 C 和 D 已存在于 GPU 上,需要对根据参数 a 选择的数组进行进一步计算。

#include <stdio.h>
#include <stdlib.h>

void selectArray(int **F, int a);

#define NN 1000
int *C, *D, *E;

int main(void)
{
int *F, a = 10; // a is the parameter used to select the array

C = (int *)malloc(NN * sizeof(int));
D = (int *)malloc(NN * sizeof(int));
E = (int *)malloc(NN * sizeof(int));

#pragma acc enter data create(C[:NN], D[:NN])
#pragma acc parallel loop present(C[:NN], D[:NN])
for (int i = 0; i < NN; i++)
{
C[i] = 10;
D[i] = 20;
}

selectArray(&F, a);

#pragma acc enter data copyin(F[:1]) create(E[:NN])

// Here, I cannot figure out how to point F to a selected array (C or D) on the device

#pragma acc parallel loop
for (int i = 0; i < NN; i++)
{
E[i] = 2 * F[i]; //further calculations on selected array on GPU
}
}

#pragma acc exit data delete (C[:NN], D[:NN], F)copyout(E[:200])
for (int i = 0; i < 200; i++)
printf("%d %d \n", i, E[i]);

return 0;
}

void selectArray(int **F, int a)
{
if (a <= 15)
{
(*F) = C;
}
else
{
(*F) = D;
}
}

在实际代码中,数组C和D是在不同的函数中计算的,而不是在主函数中计算的。我尝试在互联网上搜索来解决这个问题,但找不到任何相关的例子。我在 Windows 10 上使用 PGI 19.10 编译器。请求这方面的帮助。提前致谢

最佳答案

您只需在并行循环上添加“present(F)”,而不要在数据区域中包含“F”。由于 acc 存在表查找是通过主机地址完成的,因此如果“F”与设备上存在的现有主机地址匹配,则会将“F”与相同的设备地址相关联。但是,不要将“F”放在它自己的数据区域中,特别是不要删除它,因为它会导致同一设备阵列上的多次释放。

我稍微修改了您的代码,以便“F”在一种情况下指向“C”,在第二种情况下指向“D”。

% cat test.c
#include <stdio.h>
#include <stdlib.h>

void selectArray(int **F, int a);

#define NN 1000
int *C, *D, *E;

int main(void)
{
int *F, a = 10; // a is the parameter used to select the array

C = (int *)malloc(NN * sizeof(int));
D = (int *)malloc(NN * sizeof(int));
E = (int *)malloc(NN * sizeof(int));

#pragma acc enter data create(C[:NN], D[:NN], E[:NN])
#pragma acc parallel loop present(C[:NN], D[:NN])
for (int i = 0; i < NN; i++)
{
C[i] = 10;
D[i] = 20;
}

for (a=10;a<=20;a+=10) {
selectArray(&F, a);

#pragma acc parallel loop present(E,F)
for (int i = 0; i < NN; i++)
{
E[i] = 2 * F[i]; //further calculations on selected array on GPU
}
#pragma acc update host(E[:20])
for (int i = 0; i < 20; i++)
{
printf("a=%d E[%d]=%d \n", a, i, E[i]);
}
}
#pragma acc exit data delete(C, D, E)
return 0;
}

void selectArray(int **F, int a)
{
if (a <= 15)
{
(*F) = C;
}
else
{
(*F) = D;
}
}
% pgcc -ta=tesla -Minfo=accel test.c; a.out
main:
17, Generating enter data create(D[:1000],E[:1000],C[:1000])
18, Generating present(D[:1000],C[:1000])
Generating Tesla code
19, #pragma acc loop gang, vector(128) /* blockIdx.x threadIdx.x */
28, Generating present(E[:],F[:])
Generating Tesla code
29, #pragma acc loop gang, vector(128) /* blockIdx.x threadIdx.x */
34, Generating update self(E[:20])
39, Generating exit data delete(E[:1],D[:1],C[:1])
a=10 E[0]=20
a=10 E[1]=20
a=10 E[2]=20
a=10 E[3]=20
a=10 E[4]=20
a=10 E[5]=20
a=10 E[6]=20
a=10 E[7]=20
a=10 E[8]=20
a=10 E[9]=20
a=10 E[10]=20
a=10 E[11]=20
a=10 E[12]=20
a=10 E[13]=20
a=10 E[14]=20
a=10 E[15]=20
a=10 E[16]=20
a=10 E[17]=20
a=10 E[18]=20
a=10 E[19]=20
a=20 E[0]=40
a=20 E[1]=40
a=20 E[2]=40
a=20 E[3]=40
a=20 E[4]=40
a=20 E[5]=40
a=20 E[6]=40
a=20 E[7]=40
a=20 E[8]=40
a=20 E[9]=40
a=20 E[10]=40
a=20 E[11]=40
a=20 E[12]=40
a=20 E[13]=40
a=20 E[14]=40
a=20 E[15]=40
a=20 E[16]=40
a=20 E[17]=40
a=20 E[18]=40
a=20 E[19]=40

关于c - OpenACC:如何从指向主机上相应数组的指针选择设备上的数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59625297/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com