performance - CPU速度是否受从内存中获取指令的速度限制？-6ren

performance - CPU速度是否受从内存中获取指令的速度限制？

转载作者：行者123 更新时间：2023-12-04 22:28:17

27

4

在学习汇编时，我意识到我应该将经常访问的数据放在寄存器中而不是内存中，因为内存要慢得多。

问题是，由于首先要从内存中获取指令，CPU如何比内存运行得更快？ CPU通常会花费大量时间等待内存中的指令吗？

编辑:
要运行程序，我们需要将其编译为包含机器代码的文件。然后，我们将该文件加载到内存中，然后逐条执行一条指令。 CPU需要知道要运行的指令，然后从内存中获取那条信息。我不是在问要处理数据，而是要从内存中读取指令的过程。对不起，如果我不够清楚。

编辑2 :

示例:xor eax, eax在我的计算机上编译为31c0。我知道这条指令本身很快。但是要清除eax，CPU需要首先从内存中读取31c0。如果访问内存的速度很慢，那么读取操作将花费大量时间，而在此期间，CPU只是停滞不前？

最佳答案

与指令执行并行进行的代码提取至关重要，甚至8086都做到了(在一定程度上，预取缓冲区非常小，带宽很低)。即使这样，代码获取带宽实际上仍然是8086的主要瓶颈。

(我只是意识到您没有标记此x86，尽管您确实使用x86指令作为示例。我的所有示例都是x86，但是其他任何体系结构的基本知识都差不多。除了非x86 CPU会如果不使用已解码的uop缓存，x86是唯一仍在使用的ISA，它很难解码，因此值得缓存解码结果。)

在现代CPU中，代码获取很少成为瓶颈，因为caches和预取隐藏了延迟，并且与数据所需的带宽相比，带宽要求通常较低。 (但是，占用代码量很大的膨胀代码可能会因指令高速缓存未命中而变慢，从而导致前端停顿。)

L1I高速缓存与L1D高速缓存是分开的，并且CPU每个周期获取/解码一个至少16字节x86代码的块。具有解码uop缓存的CPU(Intel Sandybridge系列和AMD Ryzen)甚至还可以缓存已经解码的指令，以消除解码瓶颈。

请参阅http://www.realworldtech.com/sandy-bridge/3/，以获取有关英特尔Sandybridge中前端的相当详细的内容(获取/预解码/解码/重命名+问题)，并带有如下所示的框图，其中显示了英特尔Sandybridge与Intel Nehalem以及AMD Bulldozer的指令获取逻辑。 (解码在下一页)。 “预解码”阶段找到指令边界(即，在解码每个指令实际上是什么之前先解码指令长度)。

L1I高速缓存未命中导致对统一L2的请求。现代x86 CPU还具有共享的L3缓存(在多个内核之间共享)。

硬件预取将即将需要的代码带到L2和L1I中，就像将数据预取到L2和L1D中一样。大多数情况下，这对DRAM隐藏了200多个周期的延迟，通常仅在跳转到“冷”功能时失败。当运行很长的代码序列而没有分支时，它几乎总是可以领先于解码/执行，除非其他东西(例如数据加载/存储)耗尽了所有内存带宽。

您可以构造一些代码，每个周期以16个字节解码，这可能比主内存带宽高。甚至在AMD CPU上甚至更高。但是通常，解码瓶颈不仅会限制纯粹的代码获取带宽，还会限制您的工作。

另请参阅Agner Fog's microarch guide，以获取有关各种微体系结构中前端的更多信息，并为它们优化asm。

另请参见x86标签Wiki中的其他CPU性能链接。

关于performance - CPU速度是否受从内存中获取指令的速度限制？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45819146/

27

4

0

文章推荐： neo4j - Neo4j 使用哪个后端数据库来存储数据？

文章推荐：斯卡拉 : How to split words using multiple delimeters

文章推荐： sql - 当键不是数字而是字母数字值时，在循环中选择特定数量的行

文章推荐： netlogo - 如何比较Netlogo中的两个列表？

angularjs - 多个指令 [指令#1，指令#2] 要求隔离范围
我正在尝试在现有指令的基础上构建一个新指令，但我在我的过程中停止了。加载页面时，我面临以下错误: Multiple directives [directive#1, directive#2] aski
jquery - 指令 AngularJS 仅输入 1 到 10 范围内的数字，jquery 指令 AngularJS
我是 angularjs 世界的新手，我只需要在数字类型的输入中输入从 1 到 10 的数字。不使用 HTML5 的 min 和 max 属性我在 Jquery 中找到了一个示例，能否帮我将其转换为
javascript - Ionic 指令 VS 使用 Ionic Framework 的 Angular Material 指令
我想使用 ionic与 Material 设计。我被困在使用带有自定义 CSS 的 ionic 指令和 angular-material 之间。我读过使用 ionic 指令我们得到了很多高效的特性，
javascript - 普通 JS 到 Angular 指令；创建使用 Angular Directive(指令)的 DOM 元素
我创建了以下代码: var node = document.getElementById('TreeList'); var keys = Object.keys(model[0]); var trac
javascript - 在 angularjs 中，我们有 ng-disabled 指令，为什么框架没有提供 ng-enabled 指令，因为我们有 ng-show 和 ng-hide
在 AngularJs 中没有提供 ng-enabled 指令。是否有任何适当的理由不在框架中提供该指令，因为当您可以使用 ng- 时，我们同时拥有 ng-show 和 ng-hide隐藏来实现我们的
C忽略 "if"指令
我最近制作的程序有问题。基本上，它是 John Conway 人生游戏的简单版本，但它运行不正常。问题出在读取单元格及其邻居的状态并决定该单元格的 future 状态的代码中。这是代码的一部分(有点长
Dockerfile FROM 指令
Dockerfile reference关于 FROM 指令的内容如下: FROM can appear multiple times within a single Dockerfile in or
AngularJS 指令 - 隔离作用域和继承作用域
我一直在尝试理解指令中孤立作用域和继承作用域之间的区别。这是我准备让自己理解的一个例子: HTML Inside isolated scope directive: {{m
AngularJs 指令 - 如何从指令中获取属性值
知道如何从指令内部访问属性值吗？ angular.module('portal.directives', []) .directive('languageFlag', ['$r
汇编 "mov"指令
我正在通过将 c 程序与其等价的汇编程序进行比较来学习汇编。这是代码。 .file "ex3.c" .section .rodata .LC0: .string "I am %d
Jenkinsfile 'parallel' 指令
我正在尝试写一个 Jenkinsfile并行执行一系列步骤。目标是拥有两个 agents (又名。 nodes )。一个应该进行 Windows 构建，另一个应该进行 linux 构建。但是，我不希望
assembly - 指令 FYL2XP1
我想知道为什么指令 FYL2XP1在 x86 架构上精确计算数学公式 y · log2(x + 1)。这个公式有什么特别之处？最佳答案 y操作数通常是编译时常量，暂时忘记 x + 1 . 自 lo
sql - 将逗号分隔的SQL数据转为SQL "in"指令
这个问题已经有答案了: Parameterize an SQL IN clause (41 个回答) 已关闭 8 年前。第一个声明: Select GroupMember FROM Group 结果
AngularJS 指令 - 如何在异步数据加载后刷新模板
我从 this question fork 并编辑了一个 plunker 我想做的是在数据加载后更新/填充 SELECT 元素(组合框)，但有些事情不对劲。我检索数据，它位于 SELECT 元素的范围
用于解析和替换自定义元素内容的 AngularJS 指令
我想创建一个简单的 markdown 指令，它接受元素中的一些内容，解析它并用 html 替换它。所以这样: #Heading 或这个(其中 $scope.heading = '#Heading';
Ansible local_action 指令
我对 Ansible 还很陌生，对于我对 local_action 指令的理解有一个简单的问题。这是否意味着该命令完全在本地执行？假设你有这样的东西: local_action: command w
Angularjs 指令 - 通过类名选择下一个元素
我有以下 HTML: ... ... 以及以下指令: myApp.directive('specialInput', ['$timeout', function($timeout)
用于文件下载的 Apache 指令
如何在 .htaccess 中创建 Apache 指令强制文件 .mp4和 .pdf去下载？目前它们出现在浏览器窗口中。相反，我希望出现一个下载文件对话框。最佳答案将以下内容添加到 .htacce
c - fork 指令
我的问题是关于 C 中的 fork() 指令。我有以下程序: void main(){ int result, status; result = fork(); if(result=
javascript - Angularjs 指令
我想要一个类似于 ng-model 的属性指令。我只想另外将一个输入字段值绑定(bind)到一个范围变量(只是在一个方向输入字段 ->范围变量)。所以我刚刚尝试了这个指令，但无论如何我都无法调用该指令

首页

博学

6Ren·AI

商城

performance - CPU速度是否受从内存中获取指令的速度限制？