cuda - CUDA中结构的简单操作 : Segmentation fault-6ren

cuda - CUDA中结构的简单操作 : Segmentation fault

转载作者：行者123 更新时间：2023-12-02 06:49:05

25

4

这个问题在这里已经有了答案:

Copying a struct containing pointers to CUDA device

(3 个回答)

6年前关闭。

这是我第一次在 CUDA 中实现结构。在下面的程序中，我将一个结构复制到 GPU 并对数据执行基本操作，然后将结果复制回主机。

#include<stdio.h>

inline cudaError_t checkCuda(cudaError_t result)
{
    #if defined(DEBUG) || defined(_DEBUG)
        if (result != cudaSuccess) {
            fprintf(stderr, "CUDA Runtime Error: %sn", cudaGetErrorString(result));
        assert(result == cudaSuccess);
        }
    #endif
    return result;
}

typedef struct myStruct {
    int* a;
    int b;
}MyStruct;

__global__ void structOperation(MyStruct *d_data){
    int idx = threadIdx.x;

    d_data->a[idx] += 10;
}

int main(){
    MyStruct *h_data, *d_data, *out_data;

    size_t structSize = sizeof(MyStruct);
    size_t intSize = sizeof(int);


    h_data = (MyStruct *) malloc(structSize * 1);
    h_data->b = 32;
    h_data->a = (int *)malloc(intSize * h_data->b);

    out_data = (MyStruct *) malloc(structSize * 1);
    out_data->b = 32;
    out_data->a = (int *)malloc(intSize * out_data->b);

    for(int i = 0; i<32; i++){
        h_data->a[i] = i;   
    }

    //Memory allocation for the Struct
    checkCuda(cudaMalloc(&d_data, sizeof(MyStruct) * 1));
    checkCuda(cudaMalloc(&(d_data->a), sizeof(int) * 32));


    checkCuda(cudaMemcpy(&d_data, &h_data, sizeof(MyStruct) * 1, cudaMemcpyHostToDevice));
    checkCuda(cudaMemcpy(&(d_data->a), &(h_data->a), sizeof(int) * 32, cudaMemcpyHostToDevice)); 


    structOperation<<<1,32>>>(d_data);


    checkCuda(cudaMemcpy(&out_data, &d_data, sizeof(myStruct) * 1, cudaMemcpyDeviceToHost));
  //cudaMemcpy(&(out_data->a), &(d_data->a), sizeof(int) * d_data->b, cudaMemcpyDeviceToHost); 

    printf("\nDataElements : ");
    for(int i = 0; i<32; i++){
        printf("    %d",out_data->a[i]);
    }
    printf("\n");
}

执行结果是“段错误”。我想我的结构操作不正确。什么是正确的实现方式？

最佳答案

提供的代码中有几个无效的内存访问。

从主机访问设备内存(使用 cudaMalloc 分配)，如 d_data->a将导致未定义的行为(段错误等)。

cudaMemcpy将指针作为参数，而不是指针的地址。所以cudaMemcpy(&d_data, &h_data...应替换为 cudaMemcpy(d_data, h_data... .

使用设备指针作为成员分配设备对象有点棘手。它可以实现如下:

分配一个临时主机对象 (MyStruct temp)。

将设备内存分配给我们想要在设备上的成员 (cudaMalloc(&temp.a, bytes))。

分配设备对象 (cudaMalloc(&d_data, sizeof(MyStruct))。

将临时主机对象复制到设备对象 (cudaMemcpy(d_data, &temp, sizeof(MyStruct), cudaMemcpyHostToDevice))。

请记住，当您修改 d_data->a 的内容时在设备上， temp.a也将被修改，因为它们实际上指向设备上相同的内存位置。

您的最终主要功能将如下所示:

int main(){
    MyStruct *h_data, *d_data, *out_data;

    size_t structSize = sizeof(MyStruct);
    size_t intSize = sizeof(int);


    h_data = (MyStruct *) malloc(structSize * 1);
    h_data->b = 32;
    h_data->a = (int *)malloc(intSize * h_data->b);

    out_data = (MyStruct *) malloc(structSize * 1);
    out_data->b = 32;
    out_data->a = (int *)malloc(intSize * out_data->b);

    for(int i = 0; i<32; i++){
        h_data->a[i] = i;   
    }

    //Create temporary MyStruct object on host and allocate memory to its member "a" on device
    MyStruct temp;
    temp.b = h_data->b;
    checkCuda(cudaMalloc(&temp.a, 32 * sizeof(int)));

    //Copy host data to temp.a
    checkCuda(cudaMemcpy(temp.a, h_data->a, 32 * sizeof(int), cudaMemcpyHostToDevice));

    //Memory allocation for the device MyStruct
    checkCuda(cudaMalloc(&d_data, sizeof(MyStruct) * 1));
    //Copy actual object to device
    checkCuda(cudaMemcpy(d_data, &temp, sizeof(MyStruct) * 1, cudaMemcpyHostToDevice));


    structOperation<<<1,32>>>(d_data);

    //temp.a will be updated after kernel launch
    checkCuda(cudaMemcpy(out_data->a, temp.a, 32 * sizeof(int), cudaMemcpyDeviceToHost)); 

    printf("\nDataElements : ");
    for(int i = 0; i<32; i++)
    {
        printf("    %d",out_data->a[i]);
    }
    printf("\n");

    checkCuda(cudaFree(temp.a));
    checkCuda(cudaFree(d_data));

    free(h_data->a);
    free(out_data->a);
    free(h_data); 
    free(out_data);
}

关于cuda - CUDA中结构的简单操作 : Segmentation fault，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31133522/

25

4

0

文章推荐： twitter-bootstrap - Bootstrap 在 laravel 5.6 中不起作用

文章推荐： sql-server - 如何选择跨群体的最高共同值(value)

文章推荐： javascript - 对不同集合上匹配 id 的对象数组进行排序

arrays - 算法帮助 : how to divide array into N segments with least possible largest segment (balanced segmenting)
我在一个俄罗斯编程论坛上遇到了这个问题，但还没有想出一个优雅的解决方案。问题: 你有一个包含N个正整数的数组，你需要将它分成M个连续的段，使得最大段的和是可能的最小值。通过段的总数，我的意思是它所有
c - 错误 : PHDR segment not covered by LOAD segment
我正在从文本“从 0 到 1 的操作系统”中学习链接脚本，并且在文本中他们展示了一个使用关键字 PHDRS 的示例； ENTRY(main); PHDRS { headers PT_P
segmentation-fault - Gfortran : Segmentation fault with long character
一个小型测试程序在 64 位 Linux 上使用 gfortran (4.4.5) 返回段错误。 n=2_8**22_8 时不存在故障。 gdb 指示在循环的第一次迭代期间函数 mylen 中发生段错
c++ - segmentation violation Segmentation fault c++ 分子数组中的值
我正在尝试计算一个比率，当我的分子数组充满 0 时它可以工作，但是当我在分子数组中有值时会中断程序。 223 Double_t *ratio_calculations(int bin_numbers,
memory-management - Segmented paging 和 Paged segmentation 的异同？
我正在研究组合分页/分段系统，在我的书中有两种方法: 1.paged segmentation 2.segmented paging 我无法弄清楚两者之间的区别。我认为在分页分段中，段被分成页面，在分
image-processing - "semantic segmentation"与 "segmentation"和 "scene labeling"相比是什么？
语义分割只是一种重复，还是“语义分割”和“分割”之间有区别？ “场景标记”和“场景解析”有区别吗？像素级分割和像素级分割有什么区别？ (附带问题:当您拥有这种逐像素注释时，您是否可以免费获得对象检测
python - AWS X射线 : Cannot create segments inside Lambda function and segment not found
我遇到了一个非常奇怪的行为，我正在遵循在线文档，并且在创建一个段来与我的子段一起使用时，lambda 按以下顺序执行: xray_recorder.begin_segment('segment-nam
tcp - 理解 [TCP ACKed unseen segment] [TCP Previous segment not captured]
我们正在我们的服务器上进行一些负载测试，我正在使用 tshark 将一些数据捕获到 pcap 文件，然后使用 wireshark GUI 通过转到 Analyze -> expert Info 来查看
assembly - ASM 8086 : How is coding with multiple code segments different from coding with one code segment?
我是一名高中生，今年开始学习汇编。我目前正在制作 Pacman 克隆作为我的最终项目。我遇到的唯一问题是我的代码很大，*.exe 文件几乎有 64KB。所以我的问题是，如果我转向模型介质，我需要
Segment-anything学习到微调系列3_SAM微调decoder
前言本系列文章是博主在工作中使用SAM模型时的学习笔记，包含三部分： SAM初步理解，简单介绍模型框架，不涉及细节和代码 SAM细节理解，对各模块结合代码进一步分析 SAM微调实例
segmentation-fault - 虚拟内存如何发生段错误？
我很困惑进程在使用虚拟内存时如何可能出现段错误。据我了解，“虚拟”内存允许进程访问所有可用内存，然后将其映射到“实际”硬件内存。通过这种转换，进程怎么可能尝试访问不允许访问的内存部分？最佳答案听起
segmentation-fault - 向右旋转和向右疯狂操作会引发段错误
Tritwise操作（向右旋转和疯狂操作）无法正确运行，并在Malbolge编译器/解释器中引发分段错误。在看到有关Coding Challenges和Code Golf的惊人答案之后，我决定开始在
c++ - DirectX大型平面 segmentation
只是有关DirectX11镶嵌的问题。在“船体着色器”中，可以设置的最大镶嵌因子为64(不确定原因)。现在，尽管对于小型飞机已经足够了，但是对于大型飞机来说，这还远远不够，所以我想知道如何渲染大型飞
image-segmentation - 在matlab中手动调整形状
我需要在 matlab 中手动分割图像。我很想使用“impoly”，但我主要需要分割圆形对象。我在 Youtube 上的 Ali Pashaei 视频中找到了我需要的东西，在“FlowImagePr
segmentation-fault - 二维数组上的段错误
我有下面的代码。当我取消注释 temperature(i,j) = anode_temperature 时，我会出现 SegFault。 forall(i=0:Cells(1), j=0:Cells(
C程序:segmentation fault
我是 C 编程新手，我的代码中出现了段错误。该程序使用返回函数来询问用户他们的银行帐户中有多少钱。稍后我将添加代码来计算利息。感谢您为我查看此内容，因为我很难找出为什么会出现此错误。 #include
C语言: Segmentation Fault
为了测试，我编写了一个代码来计算 #include int main(void) { int p, i, primes[50], index; boo
C-Segmentation 错误
这个问题已经有答案了: What is a segmentation fault? (17 个回答) 已关闭 5 年前。最近我开始研究内置函数，但遇到了一个错误，那就是: 为什么我会遇到此程序段错误
C程序: Segmentation Fault
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
c++ - segmentation 故障的常见原因的明确列表
注意：我们有很多段错误，基本相同答案，所以我试图将其分解为一个规范的问题，例如我们有undefined reference。尽管我们有一个关于what a segmentati

首页

博学

6Ren·AI

商城

cuda - CUDA中结构的简单操作 : Segmentation fault