- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我参加了 CUDA 并行编程类(class),并且我看过许多 CUDA 线程配置示例,其中通常将所需线程数四舍五入到最接近的 32 倍数。我知道线程被分组为经线,并且如果您启动 1000 个线程,GPU 无论如何都会将其四舍五入到 1024,那么为什么要明确这样做呢?
最佳答案
该建议通常在您可能会选择各种线程块大小来解决同一问题的情况下给出。
我们以向量加法为例。假设我的向量长度为 100000。我可能会选择启动 100 个块,每个块 1000 个线程。在这种情况下,每个块将有 1000 个事件线程和 24 个非事件线程。我的线程资源平均利用率是 1000/1024 = 97.6%。
现在,如果我选择大小为 1024 的块怎么办?现在我只需要发射 98 个块。这些块中的前 97 个块在线程利用率方面得到了充分利用——每个线程都在做一些有用的事情。第 98 个块只有 672 个(共 1024 个)线程在做一些有用的事情。由于线程检查( if (idx < N)
)或内核代码中的其他构造,其他人显式处于非事件状态。所以我在那个块中有 352 个非事件线程。但是我的整体平均利用率是 100000/100352 = 99.6%
所以在上面的场景中,最好选择“完整”的线程块,可以被 32 整除。
如果您正在对长度为 1000 的向量进行向量加法,并且您打算在单个线程块中执行此操作(两者都可能是坏主意),那么您为线程块大小选择 1000 还是 1024 都没有关系。
关于parallel-processing - 为什么要在 CUDA 中启动 32 个线程的倍数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26611241/
所以这是我的情况。我有几个数字,我想四舍五入到最接近和最小的 10 的倍数。 例如,介于51到59之间的值应四舍五入到50。 Input = 59 = >Respose = 50 Input = 51
我尝试在 select2 多重选择中实现以下场景。 用户选择一些选项 用户在选择中选择“无必需程序” Select 会清除所有选定的值 Select 有一个占位符,其中包含以下文本:“无必需功能” 这
我正在寻找一种方法将数字四舍五入为最接近的 250 的倍数。例如,如果我有以下 JS: var containerHeight = $("#container").height(); ...我们假设“
大家好,我是 AngularJS 的新手,我在调用多个 http.get 时遇到问题。 $scope.countries 正在从城市获取值(value)。发生了什么事?如何调用多个http.get?
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: What does the ** operator do in Python? 以下 python 代码中的
我想用 scss 做点什么。我基本上想要它,所以我可以为每 5px 留出任何余量。因此,例如我可以写 m10 m15 m20 m25 等......它会创建 margin:10px;边距:15px;等
我正在用 C Sharp 创建一架钢琴,目前我有键盘键来播放声音。例如,键 A 播放音符 C。我遇到的问题是我想同时按下多个键并发出声音。显然我不想将所有组合都放在 keyDown 类中,因为我将不得
我仍在寻找Rails优雅的多文件上传方式。 我刚刚了解了“输入类型=”文件”多个” Rails支持吗?有什么例子吗?在Rails中如何实现将多张照片上传到相册模板的技巧? 谢谢 最佳答案 您需要的是更
我有这样的代码,可以创建多个 D3 donut 倍数。 body { font: 10px sans-serif; } svg { padding: 10px 0 0 10px; } .
如何在 numpy 中将数字取整到最接近 0.2 的倍数? 例如,我有这个: 0.2 * np.floor(xi / 0.2) 它在大多数情况下都有效,例如 >>> xi = 9.4 >>> 0.2
这个问题在这里已经有了答案: Rounding numbers to specific multiples [duplicate] (1 个回答) 关闭 6 年前。 我有一个花车。我想将它舍入到最接
我意识到这不是一个很好的标题,所以我会尝试更彻底地解释。 基本上,我有一个只有少量变化的 double 值,称为 clusterSize。然后,我有第二个 double 值,即 map 上的纬度或经度
我在 Canvas 上绘制了一个网格,当用户点击网格时,我正在绘制一个矩形。我想始终在用户单击的网格单元格顶部绘制矩形。所以我需要向下舍入到最接近的 X,在我的例子中,是 40 的倍数。 一些例子..
如何舍入为某些基本浮点单位的偶数倍(例如 0.0005f) float example_input = 2.718281828459f; float unit = 0.0005f; 使得输出的形式为2
我是 Java 编程的新手。我想将价格四舍五入到最接近的小数点后两位。 例如 38.82 变成 38.80 38.87 变成 38.90 38.85 保持不变。我做了例如1 和例如2 但结果只有小数点
我在 float 中给出了值和步数,例如: double step = 0.4; double value = 47.7121; 对于我给出的每个值和步骤对,我需要返回步骤的最接近的可表示 float
我正在尝试在我的一台服务器上运行 Drupal 8,但是在浏览器中安装 Drupal 期间,它为我提供了与运行 php -v 时不同的 PHP 版本 (7.0.23) > 在命令行 (7.1.12)
我需要将数字四舍五入到最接近的 0.11 倍数或四舍五入整数 示例: 0.99 turns to 1.00 0.87 turns to 0.88 0.59 turns to 0.55 54.01 tu
我有一个从公式计算的 double 列表。例如,其中一个 double 是 88.32547。我想将它们转换为最接近的 10 的整数倍,并将它们放入另一个变量中。 在示例中,double a = 88
我正在尝试合并 this multiples example在 this example 中看到焦点鼠标悬停 + 十字准线功能.我预期的 y 大小的十字准线一直在 x 线上射击。 See workin
我是一名优秀的程序员,十分优秀!