CudaMemcpy 不会将值从主机复制到设备-6ren

CudaMemcpy 不会将值从主机复制到设备

转载作者：太空宇宙更新时间：2023-11-04 04:37:00

26

4

我根据本教程创建了一个简单但完整的程序:http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#device-memory

#include <cuda.h>
#include <stdio.h>
#include <stdlib.h>

#define gpuErrchk(ans) { gpuAssert((ans), __FILE__, __LINE__); }
inline void gpuAssert(cudaError_t code, const char *file, int line, bool abort=true)
{
   if (code != cudaSuccess) 
   {
      fprintf(stderr,"GPUassert: %s %s %d\n", cudaGetErrorString(code), file, line);
      if (abort) exit(code);
   }
}

//Kernel definition
__global__ void VecAdd(float* A, float* B, float* C,int N)
{
    int i = blockDim.x * blockIdx.x + threadIdx.x;
    if(i < N)
        C[i] = A[i] + B[i];
}

//Host code
int main()
{
    int N = 1000;
    int i;
    FILE *f;
    size_t size = N * sizeof(float);

    //allocate input vectors h_A and h_B in host memory
    float *h_A = (float*)malloc(size);
    float *h_B = (float*)malloc(size);
    float *h_C = (float*)malloc(size);  

    //Initialize input vectors
    f = fopen("A.txt","r");
    for(i=0;i<N;i++)
        fscanf(f,"%f ",&h_A[i]);
    fclose(f);  
    f = fopen("B.txt","r");
    for(i=0;i<N;i++)
        fscanf(f,"%f ",&h_B[i]);
    fclose(f);
    //Allocate vactors in device memory
    float *d_A;
    gpuErrchk(cudaMalloc(&d_A,size));
    float *d_B;
    cudaMalloc(&d_B,size);
    float *d_C;
    cudaMalloc(&d_C,size);

    gpuErrchk(cudaMemcpy(d_A, h_A, size, cudaMemcpyHostToDevice));
    cudaMemcpy(d_B, h_B, size, cudaMemcpyHostToDevice);

    //invoke kernel
    int threadsPerBlock = 256;
    int blocksPerGrid = (N + threadsPerBlock - 1) / threadsPerBlock;

    VecAdd<<<blocksPerGrid, threadsPerBlock>>>(d_A, d_B, d_C, N);

    cudaMemcpy(h_C, d_C, size, cudaMemcpyDeviceToHost);

    f = fopen("C.txt","w");
    printf("%f \n",h_C[i]); 
    for(i=0;i<1000;i++)
        fprintf(f,"%f ",h_C[i]); 
    fclose(f);
    printf("Zakonczono obliczenia\n");
    // Free device memory
    cudaFree(d_A);
    cudaFree(d_B);
    cudaFree(d_C);
    //Free host memory
    free(h_A);
    free(h_B);
    return 0;
}

它应该从文件中读取两个 vector ，将它们添加到设备上，然后将输出打印到“C.txt”文件中。但是，它会打印一千个零。

经过一些调试后，我找到了罪魁祸首——cudaMalloc 函数。

(cuda-gdb) n42      cudaMemcpy(d_A, h_A, size, cudaMemcpyHostToDevice);(cuda-gdb) n43      cudaMemcpy(d_B, h_B, size, cudaMemcpyHostToDevice);(cuda-gdb) print d_A[0]$1 = 0(cuda-gdb) print h_A[0]$2 = 3.66192293

我想知道为什么它不起作用，这部分代码是从教程中原始复制的。

最佳答案

看来我在安装CUDA后不得不重新启动我的电脑，不仅仅是注销和登录。之后我的程序可以运行，但我不能再调试它了。有

[Thread debugging using libthread_db enabled] Using host libthread_db library "/lib/x86_64-linux-gnu/libthread_db.so.1". fatal: All CUDA devices are used for display and cannot be used while debugging. (error code = 24).

就在“运行”之后。

关于CudaMemcpy 不会将值从主机复制到设备，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29836275/

26

4

0

文章推荐： c - 如何正确地将数组指针传递给 C 中的函数

文章推荐： python - 如何在训练数据集上使用 SMAPE 评估指标？

文章推荐： javascript - 在方向更改时隐藏 jQuery Mobile 固定工具栏

文章推荐： python - 使用 PySpark 并行自定义函数

iphone - iphone 设备 UDID 、 iphone 设备 ID 和 iphone 设备 token 之间有什么区别？
iphone设备UDID、iphone设备ID和iphone设备Token之间有什么区别？通常，当我们使用苹果推送通知服务时，会使用 iPhone 设备 token 。但我的目标只是识别唯一的 i
android - 发送数据到 Android 设备 Notification to IOS 设备
我们使用 firebase 从服务器向 Android 和 IOS 设备发送通知，并且我们使用旧版 FCM 发送通知。但是当我们的应用程序在后台时，通知由系统本身处理，因此我们无法通过应用程序处理它。
iphone - 如何通过蓝牙将 iOS 设备连接到非 iOS 设备(Arduino 设备)？
在 Google 上搜索后，我发现人们说只能通过“MFi 程序”将 iOS 设备与非 iOS 设备连接起来。这是真的吗？我的项目主要集中于直接通过蓝牙与Arduino设备发送和接收信息。 iOS和非
objective-c - 如果(设备 == iPad)，如果(设备 == iPhone)
所以我有一个通用应用程序，我正在设置 UIScrollView 的内容大小。显然，iPhone 和 iPad 上的内容大小会有所不同。如何为 iPad 设置某种尺寸，为 iPhone 和 iPod t
kubernetes - 如何使用连接到主机的 block 设备，作为 pod 中的 block 设备
问题:如何在 pod 中使用连接到主机的原始设备作为 block 设备。我尝试使用类型为“BlockDevice”的“hostPath” volumes: - my-data: hostPath
ios - Google Cast 设备 DidComeOnline(设备 : GCKDevice!)从未被调用 #GoogleCastSDK
Implemented GCKDeviceScannerListener Singleton Class on ViewController, however its delegate methods
iOS APNS 设备 ID 与 Passbook 设备 ID 不匹配
我有一个 (PhoneGap) 应用程序，它将成功获得 Passbook 通行证，并且还将成功接收与 Passbook 分开的推送通知(当伪造设备 ID 时)。我遇到的问题是发送给注册设备的设备 I
ios - 访问电池供电的 iBeacon 设备(主要是 kontakt io 设备)的电池电量？
我正在尝试找到一种方法，通过我目前正在使用的 iOS 应用程序访问我的信标的电池电量。我正在使用 Kontakt 的 iBeacon 设备。我浏览了 Estimote iOS SDK，他们提供了一种实
c - NVAPI 设备 ID 与 CUDA 设备 ID 有何关系？
我正在努力让 CUDA 应用程序也能监控 GPU 的核心温度。可通过 NVAPI 访问该信息。问题是我想确保在运行代码时监控的是同一个 GPU。但是，似乎有信息表明我从 NvAPI_EnumPhy
沙盒中的 iPhone APNS 设备 token 与生产环境中的 iPhone APNS 设备 token
从沙箱模式到生产模式，设备 token 有何不同？我认为我已将一些设备 token 锁定为生产模式，并且无法将它们从开发中插入。关于如何检查有什么想法吗？最佳答案当您使用开发证书构建应用程序时
android - 文件管理器检测到 Android 设备，但 gvfs 文件夹为空。如何从终端访问 MTP 设备？
目录 /run/user/1000/gvfs 和 ~/.gvfs 分别是空的和不存在的。我的图形文件管理器 (Thunar) 能够检测和访问设备的内部和外部存储器。命令 gvfs-mount -l
Android 平板电脑无法通过 USB 端口找到 USB 设备，但可以通过 OTG 线找到 USB 设备
我有一个 Android 平板电脑，它有一个迷你 USB 端口和一个 USB 端口，我想编写一个与 USB key 通信的应用程序。我写了一个demo来找出U盘，但是没有任何反应。令我不安的是，如果
php - SOAP 网络服务不仅仅适用于 IOS 设备，它适用于 soap ui 和 Android 设备
我们将 PHP 版本从 5.4.25 更改为 5.4.45，并在服务器上安装了 MS SQL 驱动程序。在更改服务器之前，一切正常，但在更改服务器之后，我遇到了 Web 服务问题。我们的身份验证 So
支持从两个后置摄像头同时捕获的 Android 设备
我想知道是否有人使用此 API 在 Android 设备上同时从 2 个后置摄像头捕获图像或视频:https://source.android.com/docs/core/camera/concurr
可以接受强制门户上的条款的嵌入式 WiFi 设备？
我正在为客户构建一个物联网解决方案，网络管理员坚持要求设备仅通过访客网络进行连接，该网络有一个强制门户，其中的服务条款必须通过按下 UI 按钮来接受，然后才能获得外部互联网访问。到目前为止，我见过的大
delphi - 使用delphi检测USB驱动器/设备
我无法弄清楚这里的格式规则..在我的示例中，代码行太多，无法为每行添加 4 个空格，因此这里是我需要帮助的代码的链接 http://nitemsg.blogspot.com/2011/01/heres
iOS 设备 token
如果我在我的设备上接受推送通知，并且不保存设备 token ，那么我如何在自定义 View 中查看设备 token 或恢复警报 View ？我删除了应用程序并重新安装，但看不到设备 token 警报
多线程复制 block 设备
我试图找出在尝试并行比较和复制设备 block 与 pthreads 时我做错了什么。看起来我正在脱离同步并且比较阶段无法正常工作。任何帮助将不胜感激 #ifndef __dbg_h__ #defin
Android 相对布局和不同的屏幕尺寸/设备
我刚刚写完所有这些内容，但这个红色的小栏告诉我我不能发布图片或两个以上的链接。因此，如果您可以引用 this Imgur album ，那简直太好了。谢谢。我在这里相对较新，甚至对 android
MySQL --> 启用常规日志并将其移动到另一个驱动器/设备
我需要启用 mysql 常规日志并将其通过 nsf 移动到我系统中的另一个驱动器/设备! 所以，我在 my.cnf 中启用了它: general_log = 1 general_log_fi

首页

博学

6Ren·AI

商城

CudaMemcpy 不会将值从主机复制到设备