gpt4 book ai didi

go - Go语言的cgo如何编译Cuda源码?

转载 作者:IT王子 更新时间:2023-10-29 01:10:36 29 4
gpt4 key购买 nike

我用 cuda-c 编写了一个简单的程序,它可以在 eclipse nsight 上运行。这是源代码:

#include <iostream>
#include <stdio.h>


__global__ void add( int a,int b, int *c){
*c = a + b;
}

int main(void){

int c;
int *dev_c;

cudaMalloc((void**)&dev_c, sizeof(int));

add <<<1,1>>>(2,7,dev_c);

cudaMemcpy(&c, dev_c, sizeof(int),cudaMemcpyDeviceToHost);

printf("\n2+7= %d\n",c);
cudaFree(dev_c);

return 0;
}

现在我正在尝试将此代码与带有 cgo 的 Go 语言一起使用!!!所以我写了这段新代码:

package main

//#include "/usr/local/cuda-7.0/include/cuda.h"
//#include "/usr/local/cuda-7.0/include/cuda_runtime.h"
//#cgo LDFLAGS: -lcuda
//#cgo LDFLAGS: -lcurand
////default location:
//#cgo LDFLAGS: -L/usr/local/cuda-7.0/lib64 -L/usr/local/cuda-7.0/lib
//#cgo CFLAGS: -I/usr/local/cuda-7.0/include/
//
//
//
//
//
//
//
//
//
//
/*

#include <stdio.h>

__global__ void add( int a,int b, int *c){
*c = a + b;
}

int esegui_somma(void){

int c;
int *dev_c;

cudaMalloc((void**)&dev_c, sizeof(int));
add <<<1,1>>> (2,7,dev_c);
cudaMemcpy(&c, dev_c, sizeof(int),cudaMemcpyDeviceToHost);

cudaFree(dev_c);
return c;
}
*/
import "C"
import "fmt"

func main(){
fmt.Printf("il risultato è %d",C.esegui_somma)
}

但是没用!!我读到了这条错误信息:

cgo_cudabyexample_1/main.go:34:8: error: expected expression before '<' token
add <<<1,1>>> (2,7,dev_c);
^

我认为我必须为 cgo 而不是 gcc 设置 nvcc cuda 编译器。我该怎么做?我可以更改 CC 环境变量吗?最好的问候

最佳答案

我终于想出了如何做到这一点。最大的问题是 nvcc 不遵循 gcc 标准标志,并且与 clang 不同,它不会默默地忽略它们。 cgo 通过添加一堆用户未明确指定的标志来触发问题。

要使其全部正常工作,您需要将设备代码和直接调用它的函数分离到单独的文件中,并使用 nvcc 直接将它们编译/打包到共享库 (.所以)。然后,您将使用 cgo 使用您系统上的任何默认链接器链接此共享库。您唯一需要添加的是 -lcudart 到您的 LDFLAGS(链接器标志)以链接 CUDA 运行时。

关于go - Go语言的cgo如何编译Cuda源码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32589153/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com