cuda - 寄存器溢出是否可能导致 CUDA_EXCEPTION_5，Warp Out-Of-Range Address 错误？-6ren

cuda - 寄存器溢出是否可能导致 CUDA_EXCEPTION_5，Warp Out-Of-Range Address 错误？

转载作者：行者123 更新时间：2023-12-05 05:28:08

27

4

我收到 CUDA_EXCEPTION_5，Warp Out-of-range Address 错误，我正在尝试找出可能导致该错误的各种情况。

我正在努力将一个 C 项目(由其他人编写)移植到 CUDA。 C 代码非常依赖寄存器，在堆栈中实例化了许多数组。我假设很可能会发生寄存器溢出，这可能会触发 warp out-of-range 错误。

请注意，我想先让它运行起来，然后再开始优化代码。

我正在使用 Compute Capable 3.0 硬件，根据维基百科，它具有 512KB 的“每个线程本地内存”。我在别处读到，每个 SM 有 512KB 的寄存器空间。每个运行线程有可能有 512KB 的寄存器空间吗？

我目前正在按如下方式执行我的内核(是的，我知道它非常慢):

dim3 grid(28800,1);
cuPlotLRMap<<<grid,1>>>(...)

一些细节(我不知道这会有多大帮助):

我的硬件有 7 个 SM。有 112 个运行 block ，那么这是否意味着每个 block 获得 512k 寄存器空间的 1/16？

我也明白，如果一个线程超出寄存器空间，它可能会溢出到全局内存中。发生这种情况时是否有可能并发线程溢出到同一个全局内存空间？

最佳答案

512KB of "local memory per thread". I read elsewhere it has 512KB of register space per SM. Is it possible to have 512KB of register space per running thread?

参见 Compute Capabilities CUDA C 编程指南中的表格。计算能力 2.x 及更高版本的设备支持每个线程最大 512KB 的本地内存。函数 cudaDeviceSetLimit(cudaLimitStackSize, bytesPerThread) 可用于设置该值。我相信默认值是每个线程 2 KB。

My hardware has 7 SMs. There are 112 running blocks, so does this mean each block gets 1/16th of 512k worth of register space?

计算能力 3.x 设备每个多处理器最多可以有 16 个驻留 block 。这假定您的寄存器/线程、线程/ block 或共享内存/ block 不会将内核限制为小于设备最大值。 Visual Profiler 和 Nsight VSE CUDA Profiler 内核使用的配置。

目前，您只启动了 1 个线程/ block 。您应该为每个 block (32) 启动 WARP_SIZE 的倍数。

I also understand if a thread exceeds the register space it can overflow into global memory. Is it possible for concurrent threads to overflow into the same global memory space when this occurs?

在编译或 JIT 时，编译器将执行寄存器分配。如果每个线程没有足够的寄存器，那么编译器将溢出到本地内存。此操作是确定性的，在运行时不确定。

计算能力 3.0 设备限制为 63 个寄存器/线程。计算能力 3.5 设备限制为每个线程 255 个寄存器。

关于cuda - 寄存器溢出是否可能导致 CUDA_EXCEPTION_5，Warp Out-Of-Range Address 错误？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13690043/

27

4

0

文章推荐： jasper-reports - 字符串表达式的模式(格式)

文章推荐： ShellExecute Adobe Reader XI 安全警告对话框设置

文章推荐： eclipse - 为什么 MANIFEST.MF 看不到来自 Maven 的 pom 的包？

java - 如何找到 Cassandra 导致 Spark 作业中止的根本原因(导致 ClassCastException - ShuffleMapTask 到 Task)？
我正在尝试使用 Spark 从 Cassandra 读取数据。 DataFrame rdf = sqlContext.read().option("keyspace", "readypulse
ctime() 导致 SIGABRT(？!)
这是代码: void i_log_ (int error, const char * file, int line, const char * fmt, ...) { /* Get erro
导致 Gtk 在断言时中止
我必须调试一个严重依赖 Gtk 的程序。问题是由于某些原因，在使用 GtkWindow 对象时开始出现许多运行时警告。问题是，即使 Gtk 提示严重错误，它也不会因这些错误而中止。我没有代码库的更改历
glsl - glGetProgramBinary 导致 GL_INVALID_OPERATION
我正在尝试从已有效编译和链接的程序中检索二进制文件。我已经通过 GL_PROGRAM_BINARY_LENGTH 收到了它的长度。该文档说有两个实例可能会发生 GL_INVALID_OPERATION
wcf - 导致 ServiceActivationException 的原因是什么？
我有一个托管在 Azure 环境中的服务。我正在使用控制台应用程序使用该服务。这样做时，我得到了异常: "The requested service, 'http://xxxx-d.yyyy.be/S
multithreading - sem_init() 导致 SEGV
我有以下代码，它被 SEGV 信号杀死。使用调试器表明它被 main() 中的第一个 sem_init() 杀死。如果我注释掉第一个 sem_init() ，第二个会导致同样的问题。我试图弄清楚是什么
xcode - NSJSONSerialization 导致 EXC_BAD_ACCESS
目前我正在编写一个应用程序(目标 iOS 6，启用 ARC)，它使用 JSON 进行数据传输，使用核心数据进行持久存储。 JSON 数据由 PHP 脚本通过 json_encode 从 MySQL 数
android - PopAsync 导致 ArgumentOutOfRangeException
我对 Xamarin.Forms 还是很陌生。我在出现的主页上有一个非常简单的功能 async public Task BaseAppearing() { if (UserID
android - notifyDataSetChanged() 导致 IndexOutOfBoundsException
这是我的代码的简化版本。 public class MainActivity extends ActionBarActivity { private ArrayList entry = new Arr
java - 导致 NoSuchMethodError 的显式转换？
我想弄明白为什么我的两个 Java 库很难很好地协同工作。这是场景: 库 1 有一个类 A，其构造函数如下: public A(Object obj) { /* boilerplate */ } 在以
iphone - didReceiveAuthenticationChallenge 导致 EXC_BAD_ACCESS
如果网站不需要身份验证，我的代码可以正常工作，如果需要，则在打印“已创建凭据”后会立即出现 EXC_BAD_ACCESS 错误。我不会发布任何内容，并且此代码是直接从文档中复制的 - 知道出了什么问题
iphone - NSArray 导致 EXC_BAD_ACCESS
我在使用 NSArray 填充 UITableView 时遇到问题。我确信我正在做一些愚蠢的事情，但我无法弄清楚。当我尝试进行简单的计数时，我得到了 EXC_BAD_ACCESS，我知道这是因为我试图
iphone - resignFirstResponder 导致 EXC_BAD_ACCESS
我在 UITableViewCell 上有一个 UITextField，在另一个单元格上有一个按钮。我单击 UITextField(出现键盘)。 UITextField 调用了以下方法: - (BO
iphone - MKReverseGeocoder 导致 EXC_BAD_ACCESS？
我有一个应用程序出现间歇性崩溃。崩溃日志显示了一个堆栈跟踪，这对我来说很难破译，因此希望其他人看到了这一点并能为我指出正确的方向。基本上，应用程序在启动时执行反向地理编码请求，以在标签中显示用户的位
iphone - UIImageWriteToSavedPhotosAlbum 导致 EXC_BAD_ACCESS
我开发了一个 CGImage，当程序使用以下命令将其显示在屏幕上时它工作正常: [output_view.layer performSelectorOnMainThread:@selector(set
android - EncryptedSharedPreferences 导致 UnrecoverableKeyException
我正在使用新的 EncryptedSharedPreferences以谷歌推荐的方式上课: private fun securePrefs(context: Context): SharedPrefe
javascript - ClientId 导致 NullReferenceException
我有一个中继器，里面有一些控件，其中一个是文本框。我正在尝试使用 jquery 获取文本框，我的代码如下所示: $("#").click(function (event) {}); 但我总是得到 nu
android - 导致 TTS 初始化失败的原因是什么？
在以下场景中观察到 TTS 初始化错误，太随机了。已安装 TTS 引擎，存在语音集，并且可以从辅助功能选项中播放示例 tts。 TTS 初始化在之前初始化和播放的同一设备上随机失败。在不同的设备(
java - 64位VM不启动指针压缩，导致-8内存对齐
maven pom.xml org.openjdk.jol jol-core 0.10 Java 类: public class MyObjectData { pr
math - 导致 MD5 冲突的最短字符串对是什么？
在不担心冲突的情况下，可以使用 MD5 作为哈希值，字符串长度最多为多少？这可能是通过为特定字符集中的每个可能的字符串生成 MD5 哈希来计算的，长度不断增加，直到哈希第二次出现(冲突)。没有冲突的

首页

博学

6Ren·AI

商城

cuda - 寄存器溢出是否可能导致 CUDA_EXCEPTION_5，Warp Out-Of-Range Address 错误？