cuda - 理解CUDA网格维度、 block 维度和线程组织(简单解释)-6ren

cuda - 理解CUDA网格维度、 block 维度和线程组织(简单解释)

转载作者：行者123 更新时间：2023-12-03 04:20:30

27

4

如何组织线程以由 GPU 执行？

最佳答案

硬件

例如，如果 GPU 设备有 4 个多处理单元，并且每个单元可以运行 768 个线程:那么在给定时刻，真正并行运行的线程不会超过 4*768 个(如果您计划更多线程，它们将等待轮到他们)。

软件

线程以 block 的形式组织。 block 由多处理单元执行。 block 的线程可以使用 1Dimensions(x)、2Dimensions (x,y) 或 3Dim 索引 (x,y,z) 来标识(索引)，但在任何情况下 xyz <= 768对于我们的示例(其他限制适用于 x、y、z，请参阅指南和您的设备功能)。

显然，如果您需要超过 4*768 个线程，则需要超过 4 个 block 。 block 也可以按 1D、2D 或 3D 索引。有一个 block 队列等待进入GPU(因为在我们的示例中，GPU 有 4 个多处理器，并且只有 4 个 block 同时执行)。

现在是一个简单的案例:处理 512x512 图像

假设我们希望一个线程处理一个像素 (i,j)。

我们可以使用每个 64 个线程的 block 。那么我们需要 512*512/64 = 4096 block (所以有 512x512 线程 = 4096*64)

通常将线程组织在 blockDim = 8 x 8(每个 block 64 个线程)的 2D block 中(以便更轻松地索引图像)。我更喜欢将其称为threadsPerBlock。

dim3 threadsPerBlock(8, 8);  // 64 threads

和 2D gridDim = 64 x 64 block (需要 4096 block )。我更喜欢称之为 numBlocks。

dim3 numBlocks(imageWidth/threadsPerBlock.x,  /* for instance 512/8 = 64*/
              imageHeight/threadsPerBlock.y);

内核是这样启动的:

myKernel <<<numBlocks,threadsPerBlock>>>( /* params for the kernel function */ );

最后:会有类似于“4096 个 block 的队列”的内容，其中一个 block 正在等待分配给 GPU 的多处理器之一以执行其 64 个线程。

在内核中，线程要处理的像素(i，j)是这样计算的:

uint i = (blockIdx.x * blockDim.x) + threadIdx.x;
uint j = (blockIdx.y * blockDim.y) + threadIdx.y;

关于cuda - 理解CUDA网格维度、 block 维度和线程组织(简单解释)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2392250/

27

4

0

文章推荐： android-studio - ADB.exe已过时并且存在严重的性能问题

文章推荐： qt - QWebEnginePage printToPdf 只打印页面的部分内容

html - 给定布局的 Bootstrap 网格(或 IE 兼容的 CSS 网格)
您能否建议如何在 Bootstrap 或 IE 兼容的 CSS 网格中，在没有 CSS 网格的情况下进行以下布局。在大屏幕中头部，左侧堆叠的 body 和右侧覆盖头部和 body 高度的图像。 [
ios - 如何在 Objective-C 中使用 for 循环将 View 创建为网格(例如 9*9 网格、15*15 网格)
我想在 Objective-C 中绘制一个 15*15 的网格。格子颜色是蓝色的，就像在诺基亚制作“贪吃蛇”游戏的棋盘一样。我试过使用 for 循环来创建 subview ，但它似乎不起作用，我查看
具有自动填充和自动大小的 CSS 网格
我正在尝试将 CSS 网格与 grid-template-columns: repeat(auto-fill, auto) 一起使用，单元格被设置为最大宽度，导致每行一个元素。 p> 是否可以让元素宽
Magento，网格，添加带有网站链接的列
我正在努力在网格的自定义列上添加一个指向网站的简单、简单的链接。我用了 Inchoo blog为列添加自定义渲染器，它可以工作。我认为只需修改渲染并添加标签就足够了。但我的希望破灭了，行不通。如何做
具有交替线条样式的 Gnuplot 网格
使用 Gnuplot 我绘制了下图 - 现在，正如您在图像中看到的那样，很难在线条之间识别出其末端的块。所以我想用不同的颜色或样式交替着色网格。我现在用来给网格着色的代码是 - set style
WPF 网格 - 绘制自定义网格线
假设我有一个非常简单的 WPF 网格(6 行 x 6 列)，定义如下:
具有动态列的 wpf 网格
我有一个希望绑定(bind)到 WPF 网格的集合。我面临的问题是列数是动态的并且取决于集合。这是一个简单的模型: public interface IRows { string Messa
java - 如何手动填充表格/网格
我正在使用 Vaadin 8，我想制作某种混淆矩阵。我想知道是否可以根据单元格位置而不是数据提供者手动填充表格/网格的值。 referenceTable.addColumn(reference ->
悬停时带有单行的 CSS 网格
我在 http://jsfiddle.net/TsRJy/ 上创建了一个带有 div 框的网格. 问题我不知道如何使 a:hover 工作。信息重写 HTML 代码，因为表格不适合我。 http
具有自动宽度和高度的 Silverlight 网格
银光处女在这里。如何使网格周围的用户控件自动调整大小以适应内部网格宽度？目前，当浏览器窗口更宽时，用户控件的显示尺寸约为 300 或 400 像素。它在数据网格周围呈现垂直和水平滚动条，这很丑陋。我想
CSS 网格 - 将所有子项保持在一行且间距相等
这个问题已经有答案了: Equal width columns in CSS Grid (11 个回答) 已关闭 2 年前。使用 CSS Grid，当您不知道会有多少个子项时，如何将所有子项保留在一
CSS 网格，中间有一个额外的包装器
我想使用 CSS Grid 的 grid-template-areas。但问题是我正在使用的 CMS 添加了大量额外的包装器。有没有办法忽略额外的包装？因为它弄乱了漂亮的网格区域...... 我正在
extjs - 网格-按钮单击处理程序
在我的Grid中，当我单击“操作”按钮(下面的代码中显示的“删除和编辑”按钮)时，我需要弹出一个窗口，而不用警告消息提醒用户；在下面的代码中，我正在使用HANDLER handler: button
CSS 网格 - 将所有子项保持在一行且间距相等
这个问题已经有答案了: Equal width columns in CSS Grid (11 个回答) 已关闭 2 年前。使用 CSS Grid，当您不知道会有多少个子项时，如何将所有子项保留在一
grid - 网格/仓库布局上离散事件模拟的可视化
我需要模拟一个仓库，其中有几辆自动驾驶车辆在给定的布局上移动，并具有简单的优先级规则。根据我的理解，这个问题可以通过离散事件模拟(DES)轻松解决，我会使用 SimPy为了这。我看到的问题是，我似乎
跨用户控件的 WPF 网格？
在 ASP.NET 中，我可以让用户控件在页面上的表格中占据多个单元格: 用户控件1: foo bar 第1页: 并且自动调整列宽以适应最大的用户控件。这也可以在 WPF
Jquery 实时搜索和复选框过滤器、网格
我正在寻找一种方法来实时搜索我的网格+要过滤的复选框。我有一个包含学生的网格(照片和姓名)。我想要的是有一个复选框，可以过滤学生所在的不同类(class)。还有一个搜索栏，我可以在其中输入学生姓名。
具有自动完成功能的 jQuery 网格
我正在使用 jQuery 和 jQuery UI 构建一个 Web 应用程序。我陷入了僵局。我需要的是一个 jQuery 网格，它具有可编辑字段，并以某种方式在这些可编辑单元格之一上合并一个自动完成字
具有多个分组的 Javascript 网格
我想知道是否有其他 JavaScript 组件可以提供具有多个分组的网格表示。下面是jqGrid的截图我扩展了允许该功能，但它需要获取所有数据。我希望在扩展分组时加载数据。另一个修改后的 jqGri
CSS:网格、滚动条和工具提示问题
我一直在为我将在此处描述的 CSS 问题而烦恼: 在下面的示例 ( https://codesandbox.io/s/jjq4km89y5 ) 中，您可以看到一个可滚动的内容(紫色背景)和一个被左侧面

首页

博学

6Ren·AI

商城

cuda - 理解CUDA网格维度、 block 维度和线程组织(简单解释)

硬件

软件

现在是一个简单的案例:处理 512x512 图像