opencl - AMD 硬件上的 bank 冲突和 channel 冲突有什么区别？-6ren

opencl - AMD 硬件上的 bank 冲突和 channel 冲突有什么区别？

转载作者：行者123 更新时间：2023-12-01 10:38:44

25

4

我正在学习 OpenCL 编程并在 AMD GPU 上运行一些程序。我引用了 AMD OpenCL 编程指南来了解 GCN 架构的全局内存优化。我无法理解银行冲突和 channel 冲突之间的区别。
有人可以解释一下它们之间有什么区别吗？
提前致谢。

最佳答案

如果两个内存访问请求指向同一个 Controller ，则硬件将访问序列化。 这称为 channel 冲突。 这意味着，每个集成内存 Controller 电路一次可以服务于一个任务，如果您碰巧将任何两个任务的地址映射到访问同一个 channel ，它们将被串行服务。
类似地，如果两个内存访问请求进入同一个内存组，硬件会序列化访问。 这称为银行冲突。 如果有多个内存芯片，那么你应该避免使用硬件特殊宽度的步幅。
4 个 channel 和 2 个库的示例:(不是真实世界的示例，因为库必须大于或等于 channel )

address   1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17
channel   1  2  3  4  1  2  3  4  1  2   3   4   1   2   3   4   1
bank      1  2  1  2  1  2  1  2  1  2   1   2   1   2   1   2   1

所以你不应该这样读:

   address    1  3  5  7   9
   channel    1  3  1  3   1  // %50 channel conflict
   bank       1  1  1  1   1  //%100 bank conflict,serialized on bank level

也不是这个:

   address    1    5     9    13
   channel    1    1     1    1     // %100 channel conflict, serialized
   bank       1    1     1    1     // %100 bank conflict, serialized

但这可能没问题:

   address    1    6     11    16
   channel    1    2     3     4   // no conflict, %100 channel usage
   bank       1    2     1     2   // no conflict, %100 bank usage

因为步幅不是 channel 宽度的倍数，也不是银行宽度的倍数。
编辑:如果您的算法更多是本地存储优化，那么您应该注意本地数据存储 channel 冲突。最重要的是，一些卡可以使用恒定内存作为独立的 channel 源来加快读取速度。
编辑:您可以使用多个波前来隐藏基于冲突的延迟，也可以使用指令级并行性。
编辑:本地数据存储 channel 的数量比全局 channel 快得多，数量也更多，因此优化 LDS(本地数据共享)非常重要，因此在全局 channel 上统一收集然后在本地 channel 上分散不应该像在全局 channel 上分散那样有问题并在本地 channel 上统一收集。
http://developer.amd.com/tools-and-sdks/opencl-zone/amd-accelerated-parallel-processing-app-sdk/opencl-optimization-guide/#50401334_pgfId-472173
对于具有不错主板的 AMD APU，如果您的软件不可更改，您应该可以根据需要选择 n-way channel 交错或 n-way bank 交错。

关于opencl - AMD 硬件上的 bank 冲突和 channel 冲突有什么区别？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31629145/

25

4

0

文章推荐： NativeScript:GridLayout 行重叠

文章推荐： R - 选择至少 X 列符合条件的行

文章推荐： bison - "$$ = 1"在 Bison/Yacc 中是什么意思？

banking - 如何从网站上提取银行对账单？
我需要从许多不同的来源提取银行账户报表。我希望能够以某种标准化的方式获取这些数据，无论是 CSV、OFX 还是 XML 或其他格式。我只需要能够获得这些数据。我将使用我自己的帐户从中获取交易，因此那里
banking - 如何编写可以进行银行帐户转账的软件？
Closed. This question needs to be more focused。它当前不接受答案。想改善这个问题吗？更新问题，使其仅通过editing this post专注于一个问题
banking - 2010年德国银行卡问题背后的技术原因是什么？
它上过新闻(1) (2) , 但没有技术解释，只是说这是芯片上的软件错误。关于这是什么类型的错误，是否有任何进一步的信息？一次性错误、某些数字转换问题或...？编辑:显然可以通过修改终端软件来规避
banking - OFX 连接选项
我们目前使用 NSoftware 的产品，它允许我们使用 OFX 协议(protocol)直接连接到银行以下载交易和余额。 OFX 在很多银行都可以使用，但我希望从使用其他银行连接方法的其他人那里获得
arm - 'bank' ing 寄存器是什么意思？
阅读维基百科上的“ARM 架构”，发现以下说法: Registers R0-R7 are the same across all CPU modes; they are never banked. R
hadoop - 编译Pig Bank UDF错误
构建文件:C:\ my \ work \ PigBank \ contrib \ piggybank \ java \ build.xml init: compile: [echo] **
algorithm - Strange Bank(Atcoder初学者竞赛099)
为了提高取款难度，某银行允许其客户在一次操作中只取下列金额之一: 1 日元(日本货币) 6日元，6^2(=36)日元，6^3(=216)日元，... 9日元，9^2(=81)日元，9^3(=729)日
c++ - Bank Kattis 问题的算法正确性
This是我指的问题。快速总结: 输入:一个整数时间T；银行关闭的时间(以分钟为单位)和一组 c 和 t 表示此人携带的现金数量(整数)和从现在开始的时间(以分钟为单位)如果没有送达，此人将离开。服务
banking - 银行的技术限制是什么，使它们只能为您提供 18 个月的历史记录？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
javascript - 创建 "bank transaction"并应用特定规则
我需要使用一些特定规则创建银行交易的模拟。例如，如果付款类型是使用借记卡完成，则必须收取 3.2% 的费用。现在我还不能在 Controller 中设置规则。有人可以帮我吗？这是我当前的 Cont
optimization - CUDA中的共享存储库冲突: How memory is aligned to banks
据我所知，共享内存被划分为存储体，并且多个线程对同一存储体内单个数据元素的访问将导致冲突(或广播)。目前，我分配了一个相当大的数组，该数组在概念上表示两个矩阵的几对: __shared__ floa
android - Pandaboard GPIO banks 从内存中取消映射
我目前正在使用 OKL4 Hypervisor 同时运行 Android 和 RTOS，以在 Pandaboard (OMAP4430) 上对它们进行虚拟化。在加电期间的某个时刻，Linux 内核似乎
banking - 如何将 BIC 和 IBAN 转换为帐户和排序代码
现在 SEPA 要求让人们习惯了 BIC 和 IBAN，有些遗留系统无法处理这些新数据。是否有可用于将 BIC 和 IBAN 转换回排序代码和帐户的算法或工具？最佳答案下面是一个例子: 从这里 w
open-banking - Revolut OpenBanking API 身份验证和授权
我正在尝试使用 Revolut Open Banking API我无法弄清楚授权和身份验证流程是如何工作的。什么是动态客户端注册？每次启动应用程序时都应该注册应用程序吗？证书怎么样 - 它是如何工
cuda - 部分相同地址访问是否会导致 CUDA 中的 Bank 冲突？
我读了一些关于 CUDA 编程的教程。他们中的大多数人提到“如果半扭曲的所有线程访问相同的地址，则不存在存储体冲突(广播)”。我的问题是，部分相同的地址访问是否会导致CUDA共享内存中的存储体冲突？
javascript - jquery ":contains"选择器是否接受这种值 "Banking and Finance"？
我对 jquery 中的 contains 有疑问。好像只接受一个词。不是一个短语或两个词。例子: $('#div:contains('Word')'); --> This is okay $('#
java - 简单的 Java Bank Atm 登录循环错误
第一次发帖，这里的人似乎很有帮助。我目前正在编写我的第二个简单银行 atm/帐户作业。我的用户密码登录代码没有执行以下操作。 1。当在数组中找不到管脚时返回循环开始 2。如果 pin 不正确则使程序停
两个表上的 MySQL 并集，累积值又名 "bank statement"
非常感谢您的帮助。情况是我有这两个表: 表 1:借方。示例: date item value_debits 2012-08-01 item1 10 2012
php - 如何从 click bank API 获取产品？
我在点击银行 API 中工作。在该 API 中，我想显示该 API 的产品列表。我是点击银行 API 的初学者。例如 $ch = curl_init(); curl_setopt($ch, CURL
c - 非 GPU 硬件上是否会发生 Bank 冲突？
这blog post解释内存库冲突如何破坏转置函数的性能。现在我不禁想知道:“普通”cpu(在多线程上下文中)是否也会发生同样的情况？或者这是特定于 CUDA/OpenCL 的吗？或者它甚至没有出现

首页

博学

6Ren·AI

商城

opencl - AMD 硬件上的 bank 冲突和 channel 冲突有什么区别？