gpt4 book ai didi

c++ - Visual Studio 无法识别 CUDA 的 "ThreadIdx"

转载 作者:行者123 更新时间:2023-11-30 01:56:49 38 4
gpt4 key购买 nike

<分区>

Visual Studio 在以下示例中用红线突出显示“threadIdx”。

程序似乎执行成功了,所以问题只是VisualStudio中的显示问题。

我怎样才能使 Visual Studio 不再将 threadIdx 突出显示为无效?

我的环境:* 操作系统:Windows7,64位* VisualStudio2010、CUDA5.5


源代码:

 #include <cuda_runtime.h>
#include <stdio.h>
#include <math.h>
#include <cuda.h>


#define N 256
__global__ void matrix_vector_multi_gpu_1_256(float *A_d, float *B_d, float *C_d);
int main(){
int i,j;
float A[N], B[N*N], C[N];
float *A_d, *B_d, *C_d;

dim3 blocks(1,1,1);
dim3 threads(256,1,1);

for(j=0;j<N;j++){
for(i=0;i<N;i++){
B[j*N+i]=((float)j)/256.0;
}
}

for(j=0;j<N;j++){
C[j]=1.0F;
}

cudaMalloc((void**)&A_d, N*sizeof(float));
cudaMalloc((void**)&B_d, N*N*sizeof(float));
cudaMalloc((void**)&C_d, N*sizeof(float));

cudaMemcpy(A_d,A,N*sizeof(float),cudaMemcpyHostToDevice);
cudaMemcpy(B_d,B,N*N*sizeof(float),cudaMemcpyHostToDevice);
cudaMemcpy(C_d,C,N*sizeof(float),cudaMemcpyHostToDevice);

matrix_vector_multi_gpu_1_256<<<blocks,threads>>>(A_d,B_d,C_d);
cudaMemcpy(A,A_d,N*sizeof(float),cudaMemcpyDeviceToHost);

for(j=0;j<N;j++){
printf("A[ %d ]=%f \n",j,A[j]);
}
getchar();

cudaFree(A_d);
cudaFree(B_d);
cudaFree(C_d);
return 0;
}

__global__ void matrix_vector_multi_gpu_1_256(float *A_d, float *B_d, float *C_d){
int i;

A_d[threadIdx.x]=0.0F;
for(i=0;i<N;i++){
A_d[threadIdx.x]=A_d[threadIdx.x]+B_d[threadIdx.x*N+i]*C_d[i];
}
}

38 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com