c++ - CUDA 内核不返回任何内容-6ren

c++ - CUDA 内核不返回任何内容

转载作者：塔克拉玛干更新时间：2023-11-03 07:10:34

25

4

我在 Visual Studio Community 2015 中使用 CUDA Toolkit 8。当我尝试从 NVidia 的 PDF 手册中进行简单的 vector 加法时(减去我没有 *.h 的错误检查)，它总是以未定义的值返回，这意味着输出数组从未被填充。当我用 0 预填充它时，这就是我最后得到的。

其他人遇到过这个问题，有些人说这是由于针对错误的计算能力进行编译造成的。但是，我使用的是 NVidia GTX 750 Ti，它应该是 Compute Capability 5。我尝试编译 Compute Capability 2.0(我的 SDK 的最低要求)和 5.0。

我也无法使任何预编译的示例工作，例如 vectoradd.exe 说，“无法分配设备 vector A(错误代码初始化错误)!”和 oceanfft.exe 说，“错误无法找到 GLSL 顶点和片段着色器!”这没有意义，因为 GLSL 和片段着色是非常基本的功能。

我的驱动程序版本是 361.43，其他应用程序(例如 CUDA 模式下的 Blender Cycles 和 Stellarium)运行良好。

这是应该工作的代码:

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <stdio.h>
#include <iostream>
#include <algorithm>
#define N 10

__global__ void add(int *a, int *b, int *c) {
    int tid = blockIdx.x; // handle the data at this index
    if (tid < N)
        c[tid] = a[tid] + b[tid];
}

int main(void) {
    int a[N], b[N], c[N];
    int *dev_a, *dev_b, *dev_c;
    // allocate the memory on the GPU
    cudaMalloc((void**)&dev_a, N * sizeof(int));
    cudaMalloc((void**)&dev_b, N * sizeof(int));
    cudaMalloc((void**)&dev_c, N * sizeof(int));
    // fill the arrays 'a' and 'b' on the CPU
    for (int i = 0; i<N; i++) {
        a[i] = -i;
        b[i] = i * i;
    }
    // copy the arrays 'a' and 'b' to the GPU
    cudaMemcpy(dev_a, a, N * sizeof(int),cudaMemcpyHostToDevice);
    cudaMemcpy(dev_b, b, N * sizeof(int),cudaMemcpyHostToDevice);
    add << <N, 1 >> >(dev_a, dev_b, dev_c);
    // copy the array 'c' back from the GPU to the CPU
    cudaMemcpy(c, dev_c, N * sizeof(int),cudaMemcpyDeviceToHost);
    // display the results
    for (int i = 0; i<N; i++) {
        printf("%d + %d = %d\n", a[i], b[i], c[i]);
    }
    // free the memory allocated on the GPU
    cudaFree(dev_a);
    cudaFree(dev_b);
    cudaFree(dev_c);
    return 0;
}

我正在尝试开发 CUDA 应用程序，因此非常感谢任何帮助。

最佳答案

这显然是由于使用了与 CUDA 8 工具包不兼容的驱动程序版本造成的。安装随版本 8 工具包分发的驱动程序解决了这个问题。

[答案由评论组成并添加为社区维基条目，以便将问题从 CUDA 标签的未回答队列中移除]

关于c++ - CUDA 内核不返回任何内容，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42310476/

25

4

0

文章推荐： c++ - 检查一个类型是一个包含泛型 lambda 的仿函数

文章推荐： c# - 使用 P/Invoke 在托管和非托管回调链上引发异常

文章推荐： c++ - 在函数中初始化二维数组，通过指针调用。获取段错误

linux - 内核(例如 Linux 内核)的文件类型是什么？
总的来说，我对 Linux 内核和操作系统非常感兴趣。我想知道的是，内核的文件类型或扩展名是什么？它显然没有 .exe 或 .out 扩展名，因为它们用于安装在操作系统上的应用程序。内核只是一个二进
linux - 为 Arm/Raspberry PI 扩展 Rasbian 内核(Linux 内核 3.10.28)——如何正确添加自己的系统调用？
我需要为 Raspbian Linux 内核添加一个自己的系统调用。现在我在搜索了大约 2 天以找到解决方案后陷入困境。要加一个系统调用，我基本上是按照大纲来的( http://elinux.org
内核:如何为内核构建添加新的源文件？
对于一个学术项目，我希望将源文件 (myfile.c) 添加到 kernel/目录，与exit.c相同的目录和 fork.c .构建系统似乎不会自动获取新文件，因为我在 myfile.c 中定义的函数
有哪常用些浏览器/内核？
浏览器排行榜浏览器市占率排行榜全球榜。浏览器市占率排行榜中国榜 -快科技。如果按照浏览器内核来看， Chromium 内核的市场占有率无疑是最大的，一家独大
process - 内核:如何从进程的task_struct中查找所有线程？
给定一个进程或线程的任务结构，迭代属于同一进程的所有其他线程的习惯用法是什么？最佳答案 Linux 不区分进程(任务)和线程。库调用 fork() 和 pthread_create() 使用相同的系
C 内核 - while 循环期间中断不工作
我正在用c(不是linux。完全从头开始)从头开始制作一个内核，但我遇到了一些问题。我有这个代码: #include "timer.h" int ms = 0; void timer_handler(
C 内核-打印字符串不起作用
我正在从头开始制作一个 C 内核，我实际上只是从网站上复制了这段代码，因为我的代码无法工作，所以我很困惑。 void kmain(void) { const char *str = "my f
linux - 内核、内核线程和用户线程之间的区别
我不确定，如果我完全理解上述差异，所以我想自己解释一下，你可以打断我，只要我有错:“内核是创建内核线程的初始代码段。内核线程是由内核管理的进程。用户线程是进程的一部分。如果你有一个单线程进程，那么整个
比较两个结构文件(Linux 内核)
看一下struct file 定义from this code Linux 内核版本 2.6.18。我正在尝试比较代码中的两个 struct file 变量，并确定它们是否指的是同一个文件。该结构中
Linux 内核 - 从用户空间停止正在运行的内核定时器
我试图在 Linux 启动时使嵌入式设备中的 LED 闪烁。基本上，LED 闪烁表明 Linux 正在启动。为了使 LED 闪烁，我正在做以下事情在 init/main.c 中创建了一个全局定时器(
linux - 内核/用户空间和选择之间的共享内存
我有一些在 FreeBSD 和 Linux 上运行的特定硬件。我必须做一个用户空间应用程序，它将使用内核/用户空间应用程序之间的共享内存与驱动程序一起工作。我的应用程序对来自用户空间的共享内存进行忙
Linux 内核 icmp_reply
我在哪里可以找到 linux 内核中相应函数的解释，特别是对于 ICMPv4？例如:icmp_reply、icmp_send等感谢您的帮助。最好的，阿里木最佳答案探索 Linux 内核中的
Linux 内核 - 数据定义没有类型或存储类
我在 Linux Kernel 3.4 上工作，我有以下代码: /* Proximity sensor calibration values */ unsigned int als_kadc;
Linux 内核 - 等待队列
我正在阅读“罗伯特·洛夫 (Robert Love) 撰写的 Linux 内核开发第 3 版”，以大致了解 Linux 内核的工作原理..(2.6.2.3) 我对等待队列的工作方式感到困惑，例如这段代
C++ - 直接写入内存(内核)
我之前也问过同样的问题，但是我的帖子不知为何被删除了。无论如何，我正在尝试使用 C++ 并编写一个允许我直接访问内存并向其中写入内容的程序。我听说我需要对内核做一些事情，因为它是连接操作系统和应用程
Ruby:内核#`运行命令的权限被拒绝
在尝试了解 Ruby 执行方法时，我找到了这篇关于在 Ruby 中运行命令的五种方法的博文 http://mentalized.net/journal/2010/03/08/5_ways_to_run
Linux 内核/操作系统源代码文档？
是否有 Linux 发行版(Minix 除外)包含良好的源代码文档？或者，是否有一些好的文档来描述一般的 Linux 源代码？我已经下载了内核源代码，但是(不出所料)我有点不知所措，我想知道是否有一
Linux 内核 - 什么函数保存随机选择端口号的来源？
有谁知道 linux 中的哪个函数或文件包含查找用于 bind() 系统调用的随机端口的算法？我到处寻找，在 Linux 源代码中找不到包含此算法的方法。谢谢! 最佳答案这是一段又长又复杂的代码，
探索操作系统：内核、启动和系统调用的奥秘
前言首先，对于有科班背景的读者，可以跳过本系列文章。这些文章的主要目的是通过简单易懂的汇总，帮助非科班出身的读者理解底层知识，进一步了解为什么在面试中会涉及这些底层问题。否则，某些概念将始终
初识centos7与centos6的区别整理(内核、命令等)
CentOS7.2与CentOS6区别及特点 Linux 操作系统的启动首先从 BIOS 开始，接下来进入 boot loader，由 bootloader 载入内核，进行内核初始化。内核初始化的

首页

博学

6Ren·AI

商城

c++ - CUDA 内核不返回任何内容