assembly - 指令表中缺少延迟-6ren

assembly - 指令表中缺少延迟

转载作者：行者123 更新时间：2023-12-04 21:55:59

25

4

我目前正在查看 Agner Fog 的 instruction tables了解常见指令的延迟。

我希望我没有错过文档中这个问题的答案，但是谁能向我解释为什么某些指令没有延迟条目？

例如，操作数为 r,r,m 的 PEXT 指令的延迟对于 Skylake 留空？

丢失延迟的解释是什么，为什么一开始就很难获得延迟(如果是这种情况)？

最佳答案

IDK 为什么 Agner 在他的电子表格中将一些单元格留空。我认为这些都是手工输入的，因为至少有几个相当明确的错别字，例如5而不是 0.5对于某些东西的吞吐量(内存源 vinserti128 或其他东西，IIRC)。

解释是，除了您可以从 CPU 通常的工作方式推断出的信息之外，还有零信息。即通常有一个单独的负载 uop 为 ALU uop 供电，并且通常与寄存器源的 ALU uop 相同。但是一些指令可以使用广播负载，例如天湖vpsrld具有内存源移位计数(低元素适用于所有)看起来它使用广播加载 uop 而不是其通常的 ALU shuffle 来提供可变移位 uop(如 vpsrlvd 1 uop for p01)。

对于具有多个输入的多 uop 指令，Agner 仍然只列出 1 个延迟数。这不是一个完整的画面。有时第一个 uop 只需要一个输入，因此延迟来自 a -> result > b -> result .例如他列出了vpsrld (SKL 上的 p01 p5 为 2 uops)作为 1c 吞吐量/1c 延迟。两个输入都为 1c 显然是不可能的。据推测，Agner 测量了数据输入 -> 输出延迟，轮类计数的广播偏离了关键路径。 (我正在推断 p5 uops 正在做什么，因为它只是 p5:shuffle 端口。而且 SKL 有 1 uop 可变计数移位。并且不需要内存中的移位计数。显而易见的结论是这是广播随机播放或加载。)

要获得更完整的延迟数据，请参阅 https://www.uops.info/table.html

它有 a full latency breakdown for pext r64, r64, m64 :

Measurements: Latencies:

Latency operand 2 → 1: 3

Latency operand 3 → 1 (address): 8

Latency operand 3 → 1 (memory): ≤7

到目前为止，他们大多只有 Intel CPU(但也有 Zen)，但数据来自自动化测试，并分别测试每个输入到每个输出。还列出了 IACA 数据。 对于每条指令的每种形式，都有一个指向其详细测试结果的链接。

此外，他们对多 uop 指令的 uop 分割更加小心，例如 movbe r64, m64不是 2p0156 + p23，而是 p06 p15 p23(例如 bswap r64，Agner 确实得到了正确的结果)。

关于assembly - 指令表中缺少延迟，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57696901/

25

4

0

文章推荐：带有 svg 的 JavaFX 按钮

文章推荐： chartist.js - chartist js在x轴上旋转标签

文章推荐： express - 为什么我的所有 Firebase 云功能都超时？

文章推荐： fortran - Fortran中实数的精度问题

r - Leaflet R derivePolygons 缺少 lat 缺少 long
我正在尝试在 map 上绘制一些疾病事件数据的位置。我用它来导入数据: ByTown% addProviderTiles("CartoDB.Positron")%>% addPolygons
javascript - 缺少 ) 在使用异步等待的参数列表之后
我有一个文件调用 find.js，我使用 node find.js 运行，我的节点是版本 10 我不知道为什么我无法使用 async await。 const axios = require("axi
.net - 缺少 HttpContext
我有一个项目作为引用添加到 System.Web。但是，它似乎无法获取 HttpContext。这样做: Imports System.Web _ApplicationBase = HttpCont
java - 缺少 While 循环逻辑
在互联网上找到这段代码，出于某种原因它缺少 while 循环逻辑“while(i....)”，虽然我找到了 PigLatin* 问题的其他可行解决方案，但我真的很想了解这个正在工作。 *PigLati
缺少 TYPO3 管理后端模块
我工作了一整天来运行 Xampp 并在其上安装 TYPO3。现在我登录到后端，但没有显示许多管理模块，例如模板、访问等。 - 一定是我做错了什么，但我不知道。 these are the module
latex - 缺少 $ 插入
你好我有编译这个问题 \begin{equation} J = \sum_{j=1}^{C} \end{equation} 我不断收到错误 missing $ inserted 这很奇怪，因
缺少 SQLite generate_series
我正在尝试使用 SQLite CLI，但无法获得 generate_series功能来工作。我可以按照文档中的建议使用递归 CTE 对其进行模拟，但我似乎无法获得该链接中的任何示例。这是我的 sess
缺少 .NET 运行时优化服务
我目前正在开发我想要的软件，而软件正在安装，它可以在后台为软件创建 native 图像。我正在考虑使用 NGEN 并将进程优先级设置为低，因为我不希望它消耗 100% CPU。但是我发现我的计算机上
缺少 XCode 仪器自动化
我想使用 Xcodes Instruments 进行 UI 自动化测试。但似乎缺少“自动化”。我怎样才能添加这个？最佳答案如果您想使用自动化仪器，请使用 Xcode 7.3。 Apple 在 Xc
javascript - 缺少创建逻辑
我目前在 JS 开发中迈出了一小步，并编写了以下链接添加器: const button = document.getElementById('button') const listdiv = docu
ios - 缺少[在开始消息中发送表达式
此代码有什么问题: NSError *error = nil; [SFHFKeychainUtils deleteItemForUsername:@"IAPNoob01" andServiceName
flash - 缺少 AGALMiniAssembler
出于某种原因，在安装和配置(我认为)一切之后，com.adobe.utils.AGALMiniAssembler 不见了，其他一切正常。我认为我已尽一切努力让孵化器正常工作，但显然我错过了一步。如
缺少 Perl 参数
我有一个名为 new 的方法。调用 new 时，我传递了一个参数，但是当我运行应用程序时，出现没有参数或参数为空的错误。 StepReader.pm package StepReader; use s
c - 缺少 locale_t
安装 gtk 1.2(包名 gtk1)和 macports chokes 在最终的 make 中，在 libintl.h 的第 440 行。 extern locale_t libintl_newlo
javascript - 为什么我在动态生成按钮时在参数列表后出现错误 - 缺少 )？
我用按钮创建表格。这是javascript代码: function layersListTable(layers) { var content =''; $.each($(layer
javascript 缺少 ) 参数
我在使用此 javascript 时遇到此错误，任何人都可以帮我弄清楚我做错了什么吗？ $(this).prepend('Check availability »'); 它给我错误 mis
android - 缺少 sync_val_compare_and_swap_1
我有一个独立的工具链 NDK13b、api19、llvm 3.8 编译器、arm 32 位、带有 libcpp(llvm C++ 库) 我想避免依赖 libgcc，所以我构建了 compiler-rt
缺少 AndroidManifest 文件
我按照一些教程使用 phonegap 的条形码扫描器插件。但是当我从现有源创建一个新的 android 项目来创建条码库时 (step 6 in this page)我收到错误:“AndroidMan
缺少 Android 布局编辑器
我现在尝试在 Eclipse 中打开我的布局 xml 文件。我只得到错误 No XML content. Please add a root view or layout to your docume
缺少 Android 层次结构查看器
我的 android-sdk-windows\tools 目录中缺少层次结构查看器工具。工具链接: http://developer.android.com/guide/developing/too

首页

博学

6Ren·AI

商城

assembly - 指令表中缺少延迟