gpt4 book ai didi

clang 编译器能够将 OpenMP 区域卸载到 GPU

转载 作者:太空狗 更新时间:2023-10-29 15:37:33 25 4
gpt4 key购买 nike

我读到 clang 编译器可以将 OpenMP 区域卸载到 GPU。然而,我是在用 clang 编译代码的路上感到困惑。 clang 版本是我们集群中安装的是 3.9.0 (tags/RELEASE_390/final 288133)。代码我想要卸载基本上是一个矩阵矩阵乘法:

#pragma omp target parallel for  shared(C,P,T) private(i,j,k)
for (i=0; i<N; i++) {
for (j=0; j<N; j++) {
for (k=0; k<N; k++) {
C[i][j] += P[i][k]*T[k][j];
}
}
}

我正在编译

clang -O3 -fopenmp-targets=x86_64-unknown-linux-gnu mm.c
clang-3.9: warning: argument unused during compilation: '-fopenmp-targets=x86_64-unknown-linux-gnu'

我不知道我安装的 clang 版本是否能够将代码卸载到 GPU,如果可以,我该怎么做。欢迎任何评论。

最佳答案

从版本 7 开始,clang 支持将 OpenMP 卸载到 Nvidia GPU (http://releases.llvm.org/7.0.0/tools/clang/docs/ReleaseNotes.html#id12):

Clang gained basic support for OpenMP 4.5 offloading for NVPTX target.

To compile your program for NVPTX target use the following options: -fopenmp -fopenmp-targets=nvptx64-nvidia-cuda for 64 bit platforms or -fopenmp -fopenmp-targets=nvptx-nvidia-cuda for 32 bit platform.

关于clang 编译器能够将 OpenMP 区域卸载到 GPU,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48110862/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com