gpt4 book ai didi

c - 在 Cuda 中访问设备内存

转载 作者:太空宇宙 更新时间:2023-11-04 08:41:29 24 4
gpt4 key购买 nike

我试图在将主机内存复制到设备内存后访问设备内存。当尝试打印从主机内存复制到设备内存的数据时,执行结果不正确。它说段错误,我开始知道我正在尝试从不可用的设备内存打印数据或无法访问。

帮助我如何访问此设备内存,我想确保如果我修改了主机内存数据,那么当我尝试打印它时,我希望在设备内存数据中看到该更改。

下面是我的代码

// includes, system
#include <stdio.h>
#include <assert.h>

// Simple utility function to check for CUDA runtime errors
void checkCUDAError(const char *msg);


int main( int argc, char** argv)
{
// pointer and dimension for host memory
int n, dimA;
float *h_a;

// pointers for device memory
float *d_a, *d_b;

// allocate and initialize host memory
/** Bonus: try using cudaMallocHost in place of malloc **/

dimA = 8;
size_t memSize = dimA*sizeof(float);
cudaMallocHost((void**)&h_a, memSize);
//h_a = (float *) malloc(dimA*sizeof(float));
for (n=0; n<dimA; n++)
{
h_a[n] = (float) n;
}

// Part 1 of 5: allocate device memory

cudaMalloc( (void**)&d_a, memSize );
cudaMalloc( (void**)&d_b, memSize );

// Part 2 of 5: host to device memory copy
cudaMemcpy( d_a, h_a, memSize, cudaMemcpyHostToDevice );

// Part 3 of 5: device to device memory copy
cudaMemcpy( d_b, d_a, memSize, cudaMemcpyDeviceToDevice );

// clear host memory
for (n=0; n<dimA; n++)
{
printf("Data in host memory h_a %f\n", h_a[n]);
printf("Data in device memory d_a %f\n", d_a[n]);
//printf("Data in device memory d_b %f\n", d_b[n]);
h_a[n] = 0.f;
}

// Part 4 of 5: device to host copy
cudaMemcpy( h_a, d_b, memSize, cudaMemcpyDeviceToHost );

// Check for any CUDA errors
checkCUDAError("cudaMemcpy calls");

// verify the data on the host is correct
for (n=0; n<dimA; n++)
{
assert(h_a[n] == (float) n);
}

// Part 5 of 5: free device memory pointers d_a and d_b
cudaFree( d_b );
cudaFree( d_a );

// Check for any CUDA errors
checkCUDAError("cudaFree");

// free host memory pointer h_a
// Bonus: be sure to use cudaFreeHost for memory allocated with cudaMallocHost

cudaFreeHost(h_a);
//free(h_a);

// If the program makes it this far, then the results are correct and
// there are no run-time errors. Good work!
printf("cudaMallocHost is working Correct!\n");

return 0;
}

void checkCUDAError(const char *msg)
{
cudaError_t err = cudaGetLastError();
if( cudaSuccess != err)
{
fprintf(stderr, "Cuda error: %s: %s.\n", msg, cudaGetErrorString( err) );
exit(-1);
}
}

所以在将内存从 d_a 复制到 d_b 之后的代码中,当我尝试打印 d_b 内存中的数据时,它给出了一个错误。并且打印 h_a 内存给出了一个很好的结果。我在尝试打印 d_b 内存中的数据时做错了吗?

最佳答案

您不能从主机代码访问设备内存。此行是非法的:

    printf("Data in device memory d_a %f\n", d_a[n]);

它需要在主机代码中取消引用设备指针(指向设备内存的指针),这在 CUDA 中是非法的(统一内存使用除外)。

如果您想查看设备内存设置是否正确,您可以将设备内存中的数据复制回主机内存,您将在下一行代码中执行(并检查)该操作。所以只需删除 printf 语句即可。这是非法的。

关于c - 在 Cuda 中访问设备内存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23351331/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com