parallel-processing - 为什么要在 CUDA 中启动 32 个线程的倍数？-6ren

parallel-processing - 为什么要在 CUDA 中启动 32 个线程的倍数？

转载作者：行者123 更新时间：2023-12-04 08:16:25

25

4

我参加了 CUDA 并行编程类(class)，并且我看过许多 CUDA 线程配置示例，其中通常将所需线程数四舍五入到最接近的 32 倍数。我知道线程被分组为经线，并且如果您启动 1000 个线程，GPU 无论如何都会将其四舍五入到 1024，那么为什么要明确这样做呢？

最佳答案

该建议通常在您可能会选择各种线程块大小来解决同一问题的情况下给出。

我们以向量加法为例。假设我的向量长度为 100000。我可能会选择启动 100 个块，每个块 1000 个线程。在这种情况下，每个块将有 1000 个事件线程和 24 个非事件线程。我的线程资源平均利用率是 1000/1024 = 97.6%。

现在，如果我选择大小为 1024 的块怎么办？现在我只需要发射 98 个块。这些块中的前 97 个块在线程利用率方面得到了充分利用——每个线程都在做一些有用的事情。第 98 个块只有 672 个(共 1024 个)线程在做一些有用的事情。由于线程检查( if (idx < N) )或内核代码中的其他构造，其他人显式处于非事件状态。所以我在那个块中有 352 个非事件线程。但是我的整体平均利用率是 100000/100352 = 99.6%

所以在上面的场景中，最好选择“完整”的线程块，可以被 32 整除。

如果您正在对长度为 1000 的向量进行向量加法，并且您打算在单个线程块中执行此操作(两者都可能是坏主意)，那么您为线程块大小选择 1000 还是 1024 都没有关系。

关于parallel-processing - 为什么要在 CUDA 中启动 32 个线程的倍数？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26611241/

25

4

0

文章推荐： sql-server-2008 - 连接时 SQL Server 错误 223

文章推荐： svn - 在 subversion 中分支子文件夹是否有效？

文章推荐： search - SOLR-如何将构面计数限制为结果集中返回的行

php - 四舍五入到最接近和最小的 10 倍数
所以这是我的情况。我有几个数字，我想四舍五入到最接近和最小的 10 的倍数。例如，介于51到59之间的值应四舍五入到50。 Input = 59 = >Respose = 50 Input = 51
javascript - 选择指定值时清除 select2 倍数
我尝试在 select2 多重选择中实现以下场景。用户选择一些选项用户在选择中选择“无必需程序” Select 会清除所有选定的值 Select 有一个占位符，其中包含以下文本:“无必需功能” 这
javascript - 将变量四舍五入为下一个最接近的 X 倍数
我正在寻找一种方法将数字四舍五入为最接近的 250 的倍数。例如，如果我有以下 JS: var containerHeight = $("#container").height(); ...我们假设“
javascript - AngularJS 倍数 http.get
大家好，我是 AngularJS 的新手，我在调用多个 http.get 时遇到问题。 $scope.countries 正在从城市获取值(value)。发生了什么事？如何调用多个http.get？
python - ** (倍数) 在 Python 中
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: What does the ** operator do in Python? 以下 python 代码中的
css - SCSS 值(value)倍数
我想用 scss 做点什么。我基本上想要它，所以我可以为每 5px 留出任何余量。因此，例如我可以写 m10 m15 m20 m25 等......它会创建 margin:10px;边距:15px；等
c# - KeyDown 和 KeyUp 倍数
我正在用 C Sharp 创建一架钢琴，目前我有键盘键来播放声音。例如，键 A 播放音符 C。我遇到的问题是我想同时按下多个键并发出声音。显然我不想将所有组合都放在 keyDown 类中，因为我将不得
ruby-on-rails - Rails-输入类型="file"倍数
我仍在寻找Rails优雅的多文件上传方式。我刚刚了解了“输入类型=”文件”多个” Rails支持吗？有什么例子吗？在Rails中如何实现将多张照片上传到相册模板的技巧？谢谢最佳答案您需要的是更
javascript - 将 D3 工具提示应用于 donut 倍数
我有这样的代码，可以创建多个 D3 donut 倍数。 body { font: 10px sans-serif; } svg { padding: 10px 0 0 10px; } .
python - numpy 中最接近的 0.2 倍数？
如何在 numpy 中将数字取整到最接近 0.2 的倍数？例如，我有这个: 0.2 * np.floor(xi / 0.2) 它在大多数情况下都有效，例如 >>> xi = 9.4 >>> 0.2
c# - 如何将 float 舍入到最接近的 n 倍数？
这个问题在这里已经有了答案: Rounding numbers to specific multiples [duplicate] (1 个回答) 关闭 6 年前。我有一个花车。我想将它舍入到最接
java - 在 Java 中四舍五入到最接近的其他 double 倍数？
我意识到这不是一个很好的标题，所以我会尝试更彻底地解释。基本上，我有一个只有少量变化的 double 值，称为 clusterSize。然后，我有第二个 double 值，即 map 上的纬度或经度
javascript - 如何在 Javascript 中始终向下舍入到最接近的 X 倍数？
我在 Canvas 上绘制了一个网格，当用户点击网格时，我正在绘制一个矩形。我想始终在用户单击的网格单元格顶部绘制矩形。所以我需要向下舍入到最接近的 X，在我的例子中，是 40 的倍数。一些例子..
java - 某些基本 float 单位的四舍五入为偶数(或奇数)倍数
如何舍入为某些基本浮点单位的偶数倍(例如 0.0005f) float example_input = 2.718281828459f; float unit = 0.0005f; 使得输出的形式为2
java - 在 Java 中将价格四舍五入到最接近的 5cent 倍数
我是 Java 编程的新手。我想将价格四舍五入到最接近的小数点后两位。例如 38.82 变成 38.80 38.87 变成 38.90 38.85 保持不变。我做了例如1 和例如2 但结果只有小数点
c++ - 如何返回另一个 float 的最接近的可表示 float 倍数？
我在 float 中给出了值和步数，例如: double step = 0.4; double value = 47.7121; 对于我给出的每个值和步骤对，我需要返回步骤的最接近的可表示 float
php - 如何删除安装在 Apache 中的较旧的 PHP 倍数？
我正在尝试在我的一台服务器上运行 Drupal 8，但是在浏览器中安装 Drupal 期间，它为我提供了与运行 php -v 时不同的 PHP 版本 (7.0.23) > 在命令行 (7.1.12)
javascript - 通过 JavaScript 将数字四舍五入到最接近的 0.11 倍数
我需要将数字四舍五入到最接近的 0.11 倍数或四舍五入整数示例: 0.99 turns to 1.00 0.87 turns to 0.88 0.59 turns to 0.55 54.01 tu
c++ - 将 double 转换为 10 的 int 倍数
我有一个从公式计算的 double 列表。例如，其中一个 double 是 88.32547。我想将它们转换为最接近的 10 的整数倍，并将它们放入另一个变量中。在示例中，double a = 88
javascript - 带有链接焦点/鼠标悬停工具提示的 D3 倍数 : Crosshair focus line not fitting to x-axis
我正在尝试合并 this multiples example在 this example 中看到焦点鼠标悬停 + 十字准线功能.我预期的 y 大小的十字准线一直在 x 线上射击。 See workin

首页

博学

6Ren·AI

商城

parallel-processing - 为什么要在 CUDA 中启动 32 个线程的倍数？