CUDA 启动时请求的资源太多-6ren

CUDA 启动时请求的资源太多

转载作者：塔克拉玛干更新时间：2023-11-03 07:52:32

26

4

我在具有 Compute Capability 2.0 的 GTX 480 上运行我的代码时遇到了一些问题

如果我启动每个 block 有 1024 个线程的内核，我总是会遇到以下错误:

========= CUDA-MEMCHECK
========= Program hit cudaErrorLaunchOutOfResources (error 7) due to "too many resources requested for launch" on CUDA API call to cudaLaunch.
=========     Saved host backtrace up to driver entry point at error
=========     Host Frame:/usr/lib/x86_64-linux-gnu/libcuda.so.1 [0x2ef613]
=========     Host Frame:/usr/local/cuda-6.5/lib64/libcudart.so.6.5 (cudaLaunch + 0x17e) [0x3686e]
=========     Host Frame:./bin/myProgram [0x3a50]
=========     Host Frame:./bin/myProgram [0x388a]
=========     Host Frame:./bin/myProgram [0x38e3]
=========     Host Frame:./bin/myProgram [0x2a99]
=========     Host Frame:./bin/myProgram [0x1410]
=========     Host Frame:./bin/myProgram [0x1da0]
=========     Host Frame:/lib/x86_64-linux-gnu/libc.so.6 (__libc_start_main + 0xed) [0x2176d]
=========     Host Frame:./bin/myProgram [0x1139]
=========

我用不同的 block 和线程数多次运行程序:

5 Blocks, 512 Threads per Block => Works
5 Blocks, 1024 Threads per Block => Error
10 Blocks, 512 Threads per Block => Works
10 Blocks, 1024 Threads per Block => Error
15 Blocks, 512 Threads per Block => Works
15 Blocks, 1024 Threads per Block => Error

我检查了使用过的寄存器，好像没问题。具有 28 个寄存器的“Function4”是使用这么多线程的内核。所有其他 kernerls 每次调用仅使用 <<<1, 32>>>。

ptxas info    : 0 bytes gmem
ptxas info    : Function properties for _Z7function1Py
    0 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas info    : Compiling entry function '_Z13function2PyS_i' for 'sm_20'
ptxas info    : Function properties for _Z13function2PyS_i
    0 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas info    : Used 22 registers, 52 bytes cmem[0]
ptxas info    : Compiling entry function '_Z6function3PyiS_' for 'sm_20'
ptxas info    : Function properties for _Z6function3PyiS_
    0 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas info    : Used 22 registers, 56 bytes cmem[0]
ptxas info    : Compiling entry function '_Z17function4PyiiS_Phji' for 'sm_20'
ptxas info    : Function properties for _Z17function4PyiiS_Phji
    0 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas info    : Used 28 registers, 72 bytes cmem[0]

我也在我的 GTX 660 和 CC 3.0 上运行这个程序，它在每 block 1024 个线程下工作。我不知道问题出在哪里。有人有想法吗？

最佳答案

我有同样的错误。

感谢http://cuda-programming.blogspot.fr/2013/01/handling-cuda-error-messages.html ，我理解错误。他们说:

“为启动请求的资源太多 - 此错误意味着多处理器上可用的寄存器数量已超出。减少每个 block 的线程数以解决问题。”

基本上我曾经能够在每个 block 中拥有给定数量的线程(3D 内核为 8x8x16=1024)。但是，如果嵌套内核调用，则会进一步减少可用寄存器的数量。

关于CUDA 启动时请求的资源太多，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26011394/

26

4

0

文章推荐： c++ - 如何定位 WinRT 异步方法调用中出现错误的位置？

文章推荐： c++ - 运算符重载 C++ : write-only version

文章推荐： c++ - 如何将重复的字段部分合并到消息中？

文章推荐： c++ - qt #include 错误

php - (太多)太多 View 导致问题
我有一个使用 PHP 和 MariaDB 10.3 的小型大型数据库应用程序。我有大约 100 个表，大约有 3,000 个 View 。当超过 1,000 个 View 时，数据库架构就会崩溃并
regex - 解析 "\(|.*?)|)"- 太多)
parsing "\(|.*?)|)" - Too many )'s. 写这个的时候我收到这个错误... private static Regex resourceTextsREGEX = new
json - 为什么我生成的JSON的 “\\”太多？
我有一个Powershell脚本，它会生成一个包含数据的JSON文件。我对此文件有问题。它产生两倍的“\”! 你知道我该怎么解决吗？这是我的生成JSON文件的代码: [ordered]@{ pcn
Python:太多 join()？
我不确定为什么会收到此错误，我在不同点使用 str.join() 和 os.path.join()在脚本中，这是原因吗？使用os.path.join: from os.path import get
ios - b2Body 太多？
一段时间后，在我的应用程序中，似乎出现了一个大问题。有一个来自 Box2D 的 b2Bodys 的构建。我确实在我的应用程序中使用了一些 b2Body 来进行碰撞，但我会说屏幕上一次最多有 10 个。
javascript - 太多 "or"语句 (javascript)
我正在创建一个包含 6 种不同问题类型的简单数学程序。我想让程序随机显示6种类型中的一种，但有些问题应该出现得比较频繁。我使用加权数组，但从加权数组中选择问题类型后，如果不在 if 语句中使用 10
objective-c - NSView 太多？
我想构建一个包含大约 400 个单元的 Controller ，4 列，每列 100 个单元。每个单元格都必须被绘制并响应鼠标事件。这个会不会太重了？我应该为每个单元使用另一种方法，如 CALayer
Haskell 太多 where 子句，任何替代建议
我是 Haskell 的新手，在编写小程序时，我通常会使用太多的 where 子句来检查函数中的许多内容，因此编写 where 子句是一种很好的做法，或者还有其他好的替代方法吗？例如，在下面的代码中
firebase - 尝试按照部署指令部署多个功能导致错误，arg 太多
我有一个 index.js，其中包含一些导出，每个导出仅包含一个函数。我尝试一次部署其中的几个，CLI 给我以下错误； Error: Too many arguments. Run firebase
javascript - 正则表达式有(太多？)很多情况
我在正则表达式上挣扎了几个小时，似乎没有找到最后一点解决方案。我基本上是逐行解析 C 头文件以查找变量。以下是我可能遇到的需要传递正则表达式的行的情况: //#define variable_nam
PHP 和(太多)输入字段
我有一个 html 表单，大约有 1500 个输入字段*(文本或隐藏)。form.action 是 POST 并且每个输入字段都有一个唯一的名称(没有 name=foo[])。每当我在提交表单后尝试
.net - GAC 文件夹 - 太多？
我很困惑一劳永逸 VS 添加引用(/net 选项卡)说 dll 的 gac 在这里: 我发现这个包含 GAC 的文件夹:(附注:为什么有 3 个 Gac 类型？) 还有这个包含 GAC 的文件夹:
Java:实现可比较但条件 if 太多。我怎样才能避免它们？
我有一个实现Comparable的对象列表。我想对此列表进行排序，这就是我使用Comparable的原因。每个对象都有一个字段 weight，它由另外 3 个成员 int 变量组成。对于具有最大
c# - WCF channel 太多
在我们的系统中，有多个“站点”通过 WCF 相互通信。每个站点通过 NetTCP 绑定(bind)公开约 20 个接口(interface)。当一个站点使用对等站点的接口(interface)时，它
c++ - 太多 libboost_*.lib
我已经从 http://boost.teeks99.com/ 下载了 boost 1.58.0(预编译，x86，VC 12.0)并安装到C:\local\boost_1_58_0(我也试过自己用msv
mysql - COUNT UNION 太多
所以...我有一个查询，该查询返回在我的网站上使用相同的电子邮件地址、密码和其他信息创建的用户帐户(是的，实现不好，不要问)。它通过从另一个程序获取用户 ID 来实现这一点。我的 SQL 是 SEL
javascript - AngularJS 太多 Controller ？
我知道这是一个有点菜鸟的问题，但我只是想问一下，如果我有太多 Controller ，这是好事还是坏事。假设我有一个网络应用程序，它有大约 12 个 View 。每个 View 都有自己的 Contr
ios - 导航 Controller 太多？
我认为我的项目做了一些可笑的错误。我正在制作一个项目，基本上是一组 View Controller ，其中一些 Controller 上有视频，其他 Controller 上有图像。我创建了一个模型，
PHP - 太多 mysql_query ("SELECT .. ") ..?
嘿，我正在创建一个电子商店并显示类别树和所有产品及其多种价格变化，我制作了 150 多个 mysql_query("SELECT ..."); 在一页上查询。 (如果我计算“while”循环)。是不
JavaScript:太多 if-else 语句？
我在 JS 方面遇到了问题。我正在尝试制作按类型排序的三个成分列表(用于酿造药水)，所有这些都是标签内的复选框。您应该选择(选中)三个列表中每一个的一个元素才能酿造一剂药水。如果您选择正确的成分并按

首页

博学

6Ren·AI

商城

CUDA 启动时请求的资源太多