- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在这个简短的示例中,我尝试传递一个带有 struct
init 的表,其中包含 cuda 设备内存中的指针。复制到主机 -> 设备,设备 -> 主机似乎有效,但在`_global_函数中没有任何作用。
dA` 的值为 null,我无法更改它们。
我不知道如何将值从 A
复制到 dA
。如果我使用像这样的基本表 fcomplex A[N][N]
它可以工作,但这不是我想要做的。这是代码:
#include<assert.h>
#include <cuda.h>
#include <stdio.h>
#include <iostream>
#include <iomanip>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <cuda_runtime.h>
#include <cuda_runtime_api.h>
#define N 5// side of matrix containing data
#define checkCudaErrors(val) check( (val), #val, __FILE__, __LINE__)
typedef struct {float re,im;} fcomplex;
__global__ void kernel(fcomplex * da)
{
int x = threadIdx.x;
int y = threadIdx.y;
int i = (N*y) + x;
//da[i].re += 2;
printf("%f \n",da[i].re);
}
int main(int argc, char * argv[])
{
fcomplex *dA,**A,**B;
A= (fcomplex **)malloc(N * sizeof(fcomplex* ));
B=(fcomplex **)malloc(N * sizeof( fcomplex* ));
for (int i = 0; i < N; i++){
A[i] = (fcomplex *)malloc(N * sizeof(fcomplex ));
B[i] = (fcomplex *)malloc(N * sizeof(fcomplex ));
}
for (int i = 0; i < N; i++)
{ for (int d= 0; d < N; d++)
{
A[i][d].re = i*d;
A[i][d].im = i*d;
}
}
checkCudaErrors(cudaMalloc((void **)&dA, (size_t)(sizeof(fcomplex)*N*N)));
checkCudaErrors(cudaMemcpy(dA,A,N*N*sizeof(fcomplex),cudaMemcpyHostToDevice));
const dim3 blockSize(N,N);
const dim3 gridSize(1,1);
kernel<<<gridSize,blockSize>>>(dA);
checkCudaErrors(cudaThreadSynchronize());
checkCudaErrors(cudaGetLastError());
checkCudaErrors(cudaMemcpy(B, dA, sizeof(fcomplex)*N*N, cudaMemcpyDeviceToHost));
for (int i = 0; i < N; i++)
{ for (int d= 0; d < N; d++)
{
printf("%f-%f\n",A[i][d].re,B[i][d].re);
printf("%f-%f\n",A[i][d].im,B[i][d].im);
}
}
//verify(A,B,N);
free(A);
free(B);
cudaFree(dA);
//cudaFree(dB);
}
void verify(fcomplex ** A, fcomplex ** B, int size)
{
for (int i = 0; i < size; i++)
{ for (int d= 0; d < size; d++)
{
assert(A[i][d].re==B[i][d].re);
}
}
printf("Correct!");
}
最佳答案
[为简单起见,我只讨论 A,但同样适用于 B]
在 CPU 上,您分配了一个包含 N 个指针的数组 (A),然后为每个指针分配一个包含 N 个值的数组。在 GPU 上,您分配了一个由 N*N 值组成的平面数组。
这意味着您的两个数据结构不同,因此您的 cudaMemcpy()
正在复制垃圾。您有两个选择:
cudaMalloc()
,然后为每个指针使用一个 cudaMalloc()
。这有点难看,因为您需要将内部指针复制到 GPU,并且需要为每个内部指针(即行)单独调用 cudaMemcpy()
。在 CPU 和 GPU 上使用平面数据结构对于您所描述的问题来说是最简单的,如果您的实际问题更复杂,那么实现深度复制以允许数据结构内的指针并不难。
或者,您可以映射内存,以便 GPU 可以直接访问 CPU 内存,但这会影响性能,并且可能不是您想要的。
关于c - 传递带有指向 CUDA 设备内存的指针的表 init,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16233566/
我刚接触 C 语言几周,所以对它还很陌生。 我见过这样的事情 * (variable-name) = -* (variable-name) 在讲义中,但它到底会做什么?它会否定所指向的值吗? 最佳答案
我有一个指向内存地址的void 指针。然后,我做 int 指针 = void 指针 float 指针 = void 指针 然后,取消引用它们以获取值。 { int x = 25; vo
我正在与计算机控制的泵进行一些串行端口通信,我用来通信的 createfile 函数需要将 com 端口名称解析为 wchar_t 指针。 我也在使用 QT 创建一个表单并获取 com 端口名称作为
#include "stdio.h" #include "malloc.h" int main() { char*x=(char*)malloc(1024); *(x+2)=3; --
#include #include main() { int an_int; void *void_pointer = &an_int; double *double_ptr = void
对于每个时间步长,我都有一个二维矩阵 a[ix][iz],ix 从 0 到 nx-1 和 iz 从 0 到 nz-1。 为了组装所有时间步长的矩阵,我定义了一个长度为 nx*nz*nt 的 3D 指针
我有一个函数,它接受一个指向 char ** 的指针并用字符串填充它(我猜是一个字符串数组)。 *list_of_strings* 在函数内部分配内存。 char * *list_of_strings
我试图了解当涉及到字符和字符串时,内存分配是如何工作的。 我知道声明的数组的名称就像指向数组第一个元素的指针,但该数组将驻留在内存的堆栈中。 另一方面,当我们想要使用内存堆时,我们使用 malloc,
我有一个 C 语言的 .DLL 文件。该 DLL 中所有函数所需的主要结构具有以下形式。 typedef struct { char *snsAccessID; char *
指针, C语言的精髓 莫队先咕几天, 容我先讲完树剖 (因为后面树上的东西好多都要用树剖求 LCA). 什么是指针 保存变量地址的变量叫做指针. 这是大概的定义, 但是Defad认为
我得到了以下数组: let arr = [ { children: [ { children: [], current: tru
#include int main(void) { int i; int *ptr = (int *) malloc(5 * sizeof(int)); for (i=0;
我正在编写一个程序,它接受一个三位数整数并将其分成两个整数。 224 将变为 220 和 4。 114 将变为 110 和 4。 基本上,您可以使用模数来完成。我写了我认为应该工作的东西,编译器一直说
好吧,我对 C++ 很陌生,我确定这个问题已经在某个地方得到了回答,而且也很简单,但我似乎找不到答案.... 我有一个自定义数组类,我将其用作练习来尝试了解其工作原理,其定义如下: 标题: class
1) this 指针与其他指针有何不同?据我了解,指针指向堆中的内存。如果有指向它们的指针,这是否意味着对象总是在堆中构造? 2)我们可以在 move 构造函数或 move 赋值中窃取this指针吗?
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: C : pointer to struct in the struct definition 在我的初学者类
我有两个指向指针的结构指针 typedef struct Square { ... ... }Square; Square **s1; //Representing 2D array of say,
变量在内存中是如何定位的?我有这个代码 int w=1; int x=1; int y=1; int z=1; int main(int argc, char** argv) { printf
#include #include main() { char *q[]={"black","white","red"}; printf("%s",*q+3); getch()
我在“C”类中有以下函数 class C { template void Func1(int x); template void Func2(int x); }; template void
我是一名优秀的程序员,十分优秀!