在输入数据中使用各种偏移量时 CUDA 内核启动失败-6ren

在输入数据中使用各种偏移量时 CUDA 内核启动失败

转载作者：行者123 更新时间：2023-12-01 06:18:46

25

4

我的代码给出了一条错误消息，我正试图找出它的原因。为了更容易找到问题，我删除了显然与导致错误消息无关的代码。如果您能告诉我为什么以下简单代码会产生错误消息，那么我想我应该能够修复我的原始代码:

#include "cuComplex.h"
#include <cutil.h>

__device__ void compute_energy(void *data, int isample, int nsamples) {
  cuDoubleComplex * const nminusarray          = (cuDoubleComplex*)data;
  cuDoubleComplex * const f                    = (cuDoubleComplex*)(nminusarray+101);
  double          * const abs_est_errorrow_all = (double*)(f+3);
  double          * const rel_est_errorrow_all = (double*)(abs_est_errorrow_all+nsamples*51);
  int             * const iid_all              = (int*)(rel_est_errorrow_all+nsamples*51);
  int             * const iiu_all              = (int*)(iid_all+nsamples*21);
  int             * const piv_all              = (int*)(iiu_all+nsamples*21);
  cuDoubleComplex * const energyrow_all        = (cuDoubleComplex*)(piv_all+nsamples*12);
  cuDoubleComplex * const refinedenergyrow_all = (cuDoubleComplex*)(energyrow_all+nsamples*51);
  cuDoubleComplex * const btplus_all           = (cuDoubleComplex*)(refinedenergyrow_all+nsamples*51);

  cuDoubleComplex * const btplus           = btplus_all+isample*21021;

  btplus[0] = make_cuDoubleComplex(0.0, 0.0);
}

__global__ void computeLamHeight(void *data, int nlambda) {
  compute_energy(data, blockIdx.x, nlambda);
}

int main(int argc, char *argv[]) {
  void *device_data;

  CUT_DEVICE_INIT(argc, argv);
  CUDA_SAFE_CALL(cudaMalloc(&device_data, 184465640));
  computeLamHeight<<<dim3(101, 1, 1), dim3(512, 1, 1), 45000>>>(device_data, 101);
  CUDA_SAFE_CALL(cudaThreadSynchronize());
}

我使用的是 GeForce GTX 480，我正在这样编译代码:

nvcc -L /soft/cuda-sdk/4.0.17/C/lib -I /soft/cuda-sdk/4.0.17/C/common/inc -lcutil_x86_64 -arch sm_13 -O3 -Xopencc "-Wall" Main.cu

输出是:

Using device 0: GeForce GTX 480
Cuda error in file 'Main.cu' in line 31 : unspecified launch failure.

编辑:我现在进一步简化了代码。以下更简单的代码仍然会产生错误消息:

#include <cutil.h>

__global__ void compute_energy(void *data) {
  *(double*)((int*)data+101) = 0.0;
}

int main(int argc, char *argv[]) {
  void *device_data;

  CUT_DEVICE_INIT(argc, argv);
  CUDA_SAFE_CALL(cudaMalloc(&device_data, 101*sizeof(int)+sizeof(double)));
  compute_energy<<<dim3(1, 1, 1), dim3(1, 1, 1)>>>(device_data);
  CUDA_SAFE_CALL(cudaThreadSynchronize());
}

现在很容易看出偏移量应该是有效的。我尝试运行 cuda-memcheck 并显示以下内容:

========= CUDA-MEMCHECK
Using device 0: GeForce GTX 480
Cuda error in file 'Main.cu' in line 13 : unspecified launch failure.
========= Invalid __global__ write of size 8
=========     at 0x00000020 in compute_energy
=========     by thread (0,0,0) in block (0,0,0)
=========     Address 0x200200194 is misaligned
=========
========= ERROR SUMMARY: 1 error

我尝试在互联网上搜索地址未对齐是什么意思，但没有找到解释。这是怎么回事？

最佳答案

很难用所有这些神奇常量解析您的原始代码，但是您更新的重现案例使问题立即显而易见。 GPU 架构要求所有指针都与字边界对齐。您的内核包含一个未正确字对齐的指针访问。 double 是 64 位类型，您的寻址未与偶数 64 位边界对齐。这:

*(double*)((int*)data+100) = 0.0; // 50th double

或者这个:

*(double*)((int*)data+102) = 0.0; // 51st double

都是合法的。这:

*(double*)((int*)data+101) = 0.0; // not aligned to a 64 bit boundary

不是。

关于在输入数据中使用各种偏移量时 CUDA 内核启动失败，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11820912/

25

4

0

文章推荐： javascript - fullpage js 和 AOS - 不能一起工作

文章推荐： python - 如何在 Mac OS X 10.6 (Snow Leopard) 上安装 EasyGUI？

文章推荐： xaml - Windows 8 按钮在鼠标悬停时消失

文章推荐： php - 使用关联数组的索引创建可点击的链接

vba - 偏移/调整先前定义的范围
我正在尝试从第 4 到 9 页以及第 12 和 13 页上的单元格中清除所有内容(包括图像)。我有以下代码，但它正在清除第 3-9 和 12-15 页中的内容，我不知道为什么。有什么想法吗？ Sub
matplotlib:向极坐标图刻度标签添加填充/偏移
有没有办法增加极坐标图刻度标签(θ)的填充/偏移？ import matplotlib import numpy as np from matplotlib.pyplot import figure,
JavaScript 偏移/分页问题
我正在调用本地 API 并尝试以分页样式进行操作。我有 n 张图片，我想将它们分成 n/4 行(每行 4 张图片)。因此，我正在调用我的 API，images/count,offset。但不知何故，
javascript - 选择和关注网页元素不起作用(偏移)
我的问题解释起来有点棘手，但无论如何我都会尝试。我有两个水平选项卡，当您单击它们时，会打开一个文本框内容。当他们被点击时，我试图“关注”他们。我在网上找到了很多资料，但除了我在下面显示的这段代码外，没
CSS 调整大小 % - 偏移
所以我有一个 float 的 div，我需要它始终向右 200 像素，并填充窗口的其余部分。有没有某种跨浏览器兼容的方法，我可以在不借助 javascript 的情况下使宽度填满页面的其余部分？最佳
jquery - 偏移 scrollTop
我有以下片段 $('html,body').animate({scrollTop: $('#menu').offset().top}, 'slow'); 单击链接时，我希望浏览器从#menu div
ios - 偏移 UIRefreshControl
我目前正在为我的应用程序使用 JASidePanel，并且我有一个 UITableViewcontroller 和一个 UIRefreshControl 作为它的 ViewController 之一。
matplotlib - 我如何在Matplotlib中调整(偏移)颜色条标题
给出以下代码: imshow(np.arange(16*16).reshape(16,16)) cb = colorbar() cb.set_label("Foo") cb.set_ticks([0,
循环内的 VBA 偏移 - 需要永远运行
我是编程新手，我认为 VBA 是一个很好的起点，因为我在 Excel 中做了很多工作。我创建了一个宏，它从输入框中获取一个整数(我一直使用 2、3 和 4 来测试)，并创建该数字的一组 4 层层次结
PHP 偏移 unix 时间戳
我在 PHP 中有一个 unix 时间戳: $timestamp = 1346300336; 然后我有一个我想要应用的时区的偏移量。基本上，我想应用偏移量并返回一个新的 unix 时间戳。偏移量遵循这
jQuery/CSS 偏移+鼠标移动问题
演示:http://jsfiddle.net/H45uY/6/ 我在这里想做的是将的左上角设为跟随鼠标。代码在没有段落的情况下工作正常(请参阅上面的演示)，但是当您添加段落时，被向上推，鼠标位于盒
c# - 如何合并具有特定移位(偏移)的两个位图？
假设我们有两个由无符号长(64 位)数组表示的位图。我想使用特定的移位(偏移)合并这两个位图。例如，将位图 1(较大)合并到位图 2(较小)中，起始偏移量为 3。偏移量 3 表示位图 1 的第 3 位
swift - 表格 View 偏移
通过在 pageViewController 中实现 tableView，tableView 与其显示的内容不一致。对此最好的解决办法是什么？最佳答案如果您的 TableView 是 View C
iphone - 导航栏的 View 偏移
我设置了一个在 nib 中显示地点信息的地点配置文件。当我在标准屏幕流程中推送此 View 时，它工作正常。但是，当我从另一个选项卡推送此 View 时，UINavigationBar 似乎抵消了它，
mysql - 如何选择一系列行但将其从特定 ID 偏移
如果我想选择 5 条记录，我会这样做: SELECT * FROM mytable LIMIT 5 如果我想添加偏移量，我会这样做: SELECT * FROM mytable OFFSET 5 LI
android - 在全屏和非全屏之间切换导致 View 偏移
我有一个应用程序，其中某些 View 需要全屏，而其他 View 不需要全屏。在某些情况下，我希望背景显示在状态栏下方，所以我在 View 加载时使用它来使 Activity 全屏显示: window
ios - 如何使 UITouches 偏移？
在下图中，我进行绘制，结果位于 A 点，就在我手指接触的地方。如何使图像显示在实际触摸上方约 40pt。 (二) 我正在使用经典的 coreGraphic UITouch 代码，如下所示: - (v
ios - 偏移 UITextField - 表情符号布局
只要键盘处于事件状态，我就会尝试偏移 UITextField，效果很好，直到我尝试了表情符号布局。有没有办法检测键盘输入的类型，以便找出高度差？谢谢最佳答案不是使用 UIKeyboardDidSh
ios - UIToolbar 偏移 - 出现黑条
这是我的 Swift 代码 (AppDelegate.swift): var window: UIWindow? var rootViewController :UIViewController? f
html - 浏览器缩放期间的绝对 div 偏移
我有一个 div 作为绝对定位的 body 的直接子节点，其 css 属性定义如下: div[id^="Container"] { display: block; position: a

首页

博学

6Ren·AI

商城

在输入数据中使用各种偏移量时 CUDA 内核启动失败