- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我收到 CUDA_EXCEPTION_5,Warp Out-of-range Address 错误,我正在尝试找出可能导致该错误的各种情况。
我正在努力将一个 C 项目(由其他人编写)移植到 CUDA。 C 代码非常依赖寄存器,在堆栈中实例化了许多数组。我假设很可能会发生寄存器溢出,这可能会触发 warp out-of-range 错误。
请注意,我想先让它运行起来,然后再开始优化代码。
我正在使用 Compute Capable 3.0 硬件,根据维基百科,它具有 512KB 的“每个线程本地内存”。我在别处读到,每个 SM 有 512KB 的寄存器空间。每个运行线程有可能有 512KB 的寄存器空间吗?
我目前正在按如下方式执行我的内核(是的,我知道它非常慢):
dim3 grid(28800,1);
cuPlotLRMap<<<grid,1>>>(...)
一些细节(我不知道这会有多大帮助):
我的硬件有 7 个 SM。有 112 个运行 block ,那么这是否意味着每个 block 获得 512k 寄存器空间的 1/16?
我也明白,如果一个线程超出寄存器空间,它可能会溢出到全局内存中。发生这种情况时是否有可能并发线程溢出到同一个全局内存空间?
最佳答案
512KB of "local memory per thread". I read elsewhere it has 512KB of register space per SM. Is it possible to have 512KB of register space per running thread?
参见 Compute Capabilities CUDA C 编程指南中的表格。计算能力 2.x 及更高版本的设备支持每个线程最大 512KB 的本地内存。函数 cudaDeviceSetLimit(cudaLimitStackSize, bytesPerThread) 可用于设置该值。我相信默认值是每个线程 2 KB。
My hardware has 7 SMs. There are 112 running blocks, so does this mean each block gets 1/16th of 512k worth of register space?
计算能力 3.x 设备每个多处理器最多可以有 16 个驻留 block 。这假定您的寄存器/线程、线程/ block 或共享内存/ block 不会将内核限制为小于设备最大值。 Visual Profiler 和 Nsight VSE CUDA Profiler 内核使用的配置。
目前,您只启动了 1 个线程/ block 。您应该为每个 block (32) 启动 WARP_SIZE 的倍数。
I also understand if a thread exceeds the register space it can overflow into global memory. Is it possible for concurrent threads to overflow into the same global memory space when this occurs?
在编译或 JIT 时,编译器将执行寄存器分配。如果每个线程没有足够的寄存器,那么编译器将溢出到本地内存。此操作是确定性的,在运行时不确定。
计算能力 3.0 设备限制为 63 个寄存器/线程。计算能力 3.5 设备限制为每个线程 255 个寄存器。
关于cuda - 寄存器溢出是否可能导致 CUDA_EXCEPTION_5,Warp Out-Of-Range Address 错误?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13690043/
我正在尝试使用 Spark 从 Cassandra 读取数据。 DataFrame rdf = sqlContext.read().option("keyspace", "readypulse
这是代码: void i_log_ (int error, const char * file, int line, const char * fmt, ...) { /* Get erro
我必须调试一个严重依赖 Gtk 的程序。问题是由于某些原因,在使用 GtkWindow 对象时开始出现许多运行时警告。问题是,即使 Gtk 提示严重错误,它也不会因这些错误而中止。我没有代码库的更改历
我正在尝试从已有效编译和链接的程序中检索二进制文件。我已经通过 GL_PROGRAM_BINARY_LENGTH 收到了它的长度。该文档说有两个实例可能会发生 GL_INVALID_OPERATION
我有一个托管在 Azure 环境中的服务。我正在使用控制台应用程序使用该服务。这样做时,我得到了异常: "The requested service, 'http://xxxx-d.yyyy.be/S
我有以下代码,它被 SEGV 信号杀死。使用调试器表明它被 main() 中的第一个 sem_init() 杀死。如果我注释掉第一个 sem_init() ,第二个会导致同样的问题。我试图弄清楚是什么
目前我正在编写一个应用程序(目标 iOS 6,启用 ARC),它使用 JSON 进行数据传输,使用核心数据进行持久存储。 JSON 数据由 PHP 脚本通过 json_encode 从 MySQL 数
我对 Xamarin.Forms 还是很陌生。我在出现的主页上有一个非常简单的功能 async public Task BaseAppearing() { if (UserID
这是我的代码的简化版本。 public class MainActivity extends ActionBarActivity { private ArrayList entry = new Arr
我想弄明白为什么我的两个 Java 库很难很好地协同工作。这是场景: 库 1 有一个类 A,其构造函数如下: public A(Object obj) { /* boilerplate */ } 在以
如果网站不需要身份验证,我的代码可以正常工作,如果需要,则在打印“已创建凭据”后会立即出现 EXC_BAD_ACCESS 错误。我不会发布任何内容,并且此代码是直接从文档中复制的 - 知道出了什么问题
我在使用 NSArray 填充 UITableView 时遇到问题。我确信我正在做一些愚蠢的事情,但我无法弄清楚。当我尝试进行简单的计数时,我得到了 EXC_BAD_ACCESS,我知道这是因为我试图
我在 UITableViewCell 上有一个 UITextField,在另一个单元格上有一个按钮。 我单击 UITextField(出现键盘)。 UITextField 调用了以下方法: - (BO
我有一个应用程序出现间歇性崩溃。崩溃日志显示了一个堆栈跟踪,这对我来说很难破译,因此希望其他人看到了这一点并能为我指出正确的方向。 基本上,应用程序在启动时执行反向地理编码请求,以在标签中显示用户的位
我开发了一个 CGImage,当程序使用以下命令将其显示在屏幕上时它工作正常: [output_view.layer performSelectorOnMainThread:@selector(set
我正在使用新的 EncryptedSharedPreferences以谷歌推荐的方式上课: private fun securePrefs(context: Context): SharedPrefe
我有一个中继器,里面有一些控件,其中一个是文本框。我正在尝试使用 jquery 获取文本框,我的代码如下所示: $("#").click(function (event) {}); 但我总是得到 nu
在以下场景中观察到 TTS 初始化错误,太随机了。 已安装 TTS 引擎,存在语音集,并且可以从辅助功能选项中播放示例 tts。 TTS 初始化在之前初始化和播放的同一设备上随机失败。 在不同的设备(
maven pom.xml org.openjdk.jol jol-core 0.10 Java 类: public class MyObjectData { pr
在不担心冲突的情况下,可以使用 MD5 作为哈希值,字符串长度最多为多少? 这可能是通过为特定字符集中的每个可能的字符串生成 MD5 哈希来计算的,长度不断增加,直到哈希第二次出现(冲突)。没有冲突的
我是一名优秀的程序员,十分优秀!