cpu - 了解 CPU 流水线阶段与指令吞吐量-6ren

cpu - 了解 CPU 流水线阶段与指令吞吐量

转载作者：行者123 更新时间：2023-12-03 20:20:16

27

4

我遗漏了一些基本的东西。 CPU 流水线:在基本层面上，为什么指令需要不同数量的时钟周期才能完成，为什么有些指令在多级 CPU 中只需要 1 个周期？

除了明显的“不同的指令需要不同的工作量才能完成”，听我说完...

考虑具有大约 14 级流水线的 i7。完成运行需要 14 个时钟周期。 AFAIK，这应该意味着整个流水线有 14 个时钟的延迟。然而事实并非如此。

XOR 在 1 个周期内完成并有 1 个周期的延迟，表明它没有经过所有 14 个阶段。 BSR 有 3 个周期的延迟，但每个周期有 1 个吞吐量。 AAM 的延迟为 20 个周期(多于阶段数)，吞吐量为 8(在 Ivy Bridge 上)。

有些指令不能每个时钟都发出，但需要少于 14 个时钟才能完成。

我知道多个执行单元。我不明白延迟和吞吐量方面的指令长度与流水线阶段的数量有何关系。

最佳答案

我认为现有答案中缺少的是“旁路”或“转发”数据路径的存在。为简单起见，让我们坚持使用 MIPS 5 级流水线。每条指令从诞生到死亡需要 5 个周期——获取、解码、执行、存储、写回。这就是处理一条指令所需的时间。

您想知道一条指令将其结果传递给相关指令需要多长时间。假设您有两个连续的 ADD 指令，并且存在通过 R1 的依赖关系:

ADD R1, R2, R3
ADD R4, R1, R5

如果没有转发路径，我们必须将第二条指令暂停多个周期(2 或 3 取决于回写的工作方式)，以便第一个指令可以在第二个指令之前将其结果存储到寄存器文件中在解码阶段将其读取为输入。

但是，存在允许从管道中挑选出有效结果(但尚未写回的结果)的转发路径。因此，假设第一个 ADD 在解码中从寄存器文件中获取所有输入。第二个将从寄存器文件中取出 R5，但它会在执行阶段后从流水线寄存器中取出 R1。换句话说，我们在一个周期后将 ALU 的输出路由回其输入。

无序处理器无处不在地使用转发。他们将有许多不同的功能单元，这些单元有很多不同的延迟。例如，ADD 和 AND 通常需要一个周期(做数学运算，抛开之前和之后的所有流水线阶段)，MUL 大约需要 4 个，浮点运算需要很多周期，内存访问具有可变延迟(由于缓存未命中)等。

通过使用转发，我们可以将指令的关键路径限制为仅执行单元的延迟，而其他所有内容(获取、解码、退出)都在关键路径之外。指令被解码并转储到指令队列中，等待其他执行指令产生它们的输入。当一条指令的依赖性得到满足时，它就可以开始执行。

让我们考虑这个例子

MUL R1,R5,R6
ADD R2,R1,R3
AND R7,R2,R8

我将尝试绘制一条时间线来显示这些指令在流水线中的流动。

MUL  FDIXXXXWR
ADD   FDIIIIXWR
AND    FDIIIIXWR

键:

F - Fetch
D - Decode
I - Instruction queue (IQ)
X - execute
W - writeback/forward/bypass
R - retire

因此，如您所见，乘法指令的总生命周期为 9 个周期。但是 MUL 和 ADD 的执行有重叠，因为处理器是流水线的。当 ADD 进入 IQ 时，它必须等待其输入 (R1)，同样依赖于 ADD 结果的 AND (R2) 也是如此。我们关心的不是 MUL 总共存活了多长时间，而是任何依赖指令必须等待多长时间。这是它的有效延迟，即 4 个周期。正如您所看到的，一旦 ADD 执行，依赖的 AND 就可以在下一个循环中执行，再次由于转发。

关于cpu - 了解 CPU 流水线阶段与指令吞吐量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32689200/

27

4

0

文章推荐： java - 在 arraylist 中添加元素的 SQL 查询

文章推荐： r - 如何手动或离线从 github 安装 R 包

C/我如何从这里到达第 2 阶段？它只是循环并直接进入第 3 阶段
这是贪吃蛇游戏的部分代码。我想做的是制作关卡(大约3个)，如果分数达到一定的分数(100或200)，关卡就会改变。在这段代码中，我尝试让分数达到 100 时进入第 2 阶段。但正如我编码的那样，它只
javascript - 阶段 - 我的图像无法加载
我是移相器新手。我开始看 youtube 系列，我首先有问题。我的背景图片无法加载。我有这个js代码 /* global Phaser */ var game = new Phaser.Game(12
javafx - 如何最小化靠近系统托盘的 javafx 阶段？
我有一个包含 2 个阶段的应用程序，我不希望用户关闭第二个阶段，只需将其图标化即可。目前我正在使用 oncloseRequest 处理程序来最小化窗口 - secondaryStage.setOnC
maintenance - 将网站更新从开发/阶段/测试环境推向生产的最佳实践是什么？
现在，我有一台运行服务器的基本LAMP配置。生产服务器是slicehost。但是我想知道将代码/数据库实例推送到阶段dev> stage> production的最佳方法是什么。它与您创建阶段的方式有
java - 阶段 : Not resizing to Scene
我在舞台上有一个场景。场景的宽度为 337.0 像素。但是，当我将它添加到舞台时，舞台的大小为 337.6 像素，由于 0.6 像素的差异，在屏幕的右边缘留下了一个白色间隙。我尝试使用 stage.
javafx-2 - 如何拖动JavaFX的未修饰窗口(阶段)
我有这个未修饰的窗口： public static void initStartPage(final Stage primaryStage) { final Stage startPa
maven - 执行特定的 Maven 阶段
有什么方法可以在 Maven 构建中执行特定阶段。例如，如果我只想运行那些在预集成阶段执行的插件，Maven 是否提供了一种方法来做到这一点？ e.g. mvn pre-integration-pha
jenkins - Jenkins 管道中的条件步骤/阶段
仅在构建特定分支时如何运行构建步骤/阶段？例如，仅当分支名为 deployment 时才运行部署步骤，其他所有内容保持不变。最佳答案在声明性管道语法中执行相同的操作，下面是一些示例: stage
hadoop - 配置单元查询无法启动 map 阶段
我有一个简单的查询，试图在Hive 0.14中运行: select sum(tb.field1), sum(tb.field2), tb.month from dbwork.mytable tb gr
Git 相当于 Mercurial 阶段？
在 Mercurial 中，我经常使用 secret 变更集来跟踪我对尚未准备好推送的内容的工作。然后，如果我需要对某些文件进行紧急更改，我可以更新到公共(public)修订版，进行更改并推送它，而不
Heroku + 插件提供商 Alpha 阶段
我一直在为 Heroku 的新附加组件工作，目前它是 alpha 阶段。因此，目前，我无法在我创建的应用程序上添加该附加组件，因为没有按钮可供我添加它。有人可以向我指出一些可以帮助我解决问题的资源吗？
java - 来自另一个线程的最小化 javafx 阶段
我有 2 个线程正在运行，一个正在监听 soket 等待命令，另一个启动 javafx 应用程序 public class GraphicInterface extends Application i
java - 如何关闭并图标化 JavaFx 阶段
在我的 Java Fx 应用程序中，我创建了两个阶段。第一阶段是主 Controller 类 HomeController 中的默认阶段。第二个 AddNewEmailController 是通过调用
java - 通过单个类管理不同的 JavaFX 阶段
我正在编写一个简单的 JavaFX 应用程序，它具有三个阶段:登录、注册 (Anmeldung) 和欢迎 (Anwendung)。抱歉采用德语命名! 我已经在 App 类中创建了每个舞台及其场景，在
jquery - 如何将表单重置为上次保存(通过ajax)阶段
问题是我正在使用 jQuery("form")[0].reset(); 在需要时重置表单。此方法正在将形式重置到初始阶段。这里初始阶段的意思是“表单第一次加载到页面时带有一些值的阶段”。但我需要的是
java - 强制执行 Maven 阶段
我有一个带有 pre-integration-test 和 post-integration-test 阶段的 Maven POM，如下所示。 start-server pre-in
ios - 调试 xcode 阶段？
我遇到一个错误，我已经为网络制作了一个 UIPageController，但我似乎无法找到它的问题，只有一个错误，请帮忙。代码如下 - 更多代码点播。 @interface ContentViewCo
javascript - 在不损失质量的情况下缩小 Konvajs 阶段
考虑在其中放置一些文本的大型 (2000x1000) 舞台。舞台缩小到 1000x500，使文本不可读。然后我们尝试通过放大来放大文本。预期:文本应该在某个时候再次变得可读。实际:无论我们放大多少
html - 如何在网页中居中 KineticJS 阶段
试图在网页中居中 KineticJS 阶段。尝试过: 但它集中在舞台的左侧，而不是舞台的中间。我错过了什么？最佳答案 margin:auto 可以对齐这个div中心关于htm
java - 无法处理部署的 POST_MODULE 阶段
我正在 jboss 中部署一个简单的 Web 应用程序，其中包含一个 servlet、一个 jsp 文件和一个 easy EJB。这是 servlet 的代码: package webejb; imp

首页

博学

6Ren·AI

商城

cpu - 了解 CPU 流水线阶段与指令吞吐量