gpt4 book ai didi

c++ - CUDA程序的问题

转载 作者:太空宇宙 更新时间:2023-11-04 06:43:13 29 4
gpt4 key购买 nike

这是我的代码:

#include <vector_types.h>
#define sizeOfGrid 5
__global__ void stuff( float3 *grid ) {
grid[0].x = 0.4f; //PROBLEM HERE?!
}
int main( void ) {
float3 *grid[sizeOfGrid];
float3 *dev_grid;
HANDLE_ERROR(cudaMalloc( (void**)&dev_grid, sizeOfGrid*sizeof(float3)));
for(int i = 0; i < sizeOfGrid; i++)
{
grid[i] = new float3();
grid[i]->x = 1.3f;
grid[i]->y = 1.3f;
grid[i]->z = 1.3f;
}


HANDLE_ERROR(cudaMemcpy(dev_grid, grid, sizeOfGrid * sizeof(float3), cudaMemcpyHostToDevice));
stuff<<<sizeOfGrid, 1>>> (dev_grid);
cudaMemcpy(grid, dev_grid, sizeOfGrid*sizeof(float3), cudaMemcpyDeviceToHost);
cudaFree(dev_grid);
}

现在它只是一个测试程序,并没有做任何有用的事情。编译并运行良好,但它似乎没有正确设置 grid[0]。是不是我在设备代码中把grid[0]设置错了?

最佳答案

float3 *grid[sizeOfGrid];

您分配的是指向 float3 的指针数组,而不是 float3 数组。你应该声明

float3 grid[sizeOfGrid];

并使用 .而不是 -> 或

float3 *grid;

并使用 malloc 和 free。

关于c++ - CUDA程序的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5136419/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com