cpu-architecture - 存储队列和存储缓冲区有什么区别？-6ren

cpu-architecture - 存储队列和存储缓冲区有什么区别？

转载作者：行者123 更新时间：2023-12-04 08:31:24

27

4

我正在阅读许多论文，它们要么交替使用存储缓冲区和存储队列，要么它们与不同的结构有关，我就是无法跟进。这就是我认为的商店队列:

它是一个可关联搜索的 FIFO 队列，以获取顺序保存有关存储指令的信息。

它保存存储地址和数据。

它保留存储指令的数据，直到指令变为非推测性，即它们达到退休阶段。存储指令的数据只有在到达退出阶段时才会从存储队列发送到内存(在这种情况下为 L1 高速缓存)。这一点很重要，因为我们不希望将推测性存储数据写入内存，因为它会扰乱有序的内存状态，并且在发生错误预测的情况下我们将无法修复内存状态。

在发生错误预测时，与在错误预测指令之后提取的存储指令相对应的存储队列中的信息被移除。

加载指令向 L1 缓存和存储队列发送读取请求。如果在存储队列中找到具有相同地址的数据，则将其转发到加载指令。否则，使用从 L1 获取的数据。

我不确定存储缓冲区是什么，但我认为它只是一些缓冲区空间，用于保存已停用的存储指令的数据等待写入内存(同样，L1)。

现在，这就是我感到困惑的原因。在 this论文指出，“我们提出了可扩展存储缓冲区 [SSB]，它将私有(private)/推测值直接放入 L1 缓存，从而消除了传统存储缓冲区的不可扩展关联搜索。”我认为他们正在谈论的不可扩展的关联搜索传统结构就是我所知道的商店队列，因为他们也说

SSB eliminates the non-scalable associative search of conventional store buffers by forwarding processor-visible/speculative values to loads directly from the L1 cache.

正如我上面提到的，据我所知，数据转发到负载是通过存储队列完成的。在第一页的脚注中，还指出

We use "store queue" to refer to storage that holds stores’ values prior to retirement and "store buffer" to refer to storage containing retired store values prior to their release to memory.

这与我上面解释的一致，但是它与第一个引号中的“存储缓冲区”冲突。脚注对应于 references 之一在论文中。在那个引用文献中，他们说

a store buffer is a mechanism that exists in many current processors to accomplish one or more of the following: store access ordering, latency hiding and data forwarding.

同样，我认为实现这些的机制称为存储队列。他们后来在同一篇论文中说

non-blocking caches and buffering structures such as write buffers, store buffers, store queues, and load queues are typically employed.

所以，他们分别提到了存储缓冲区和存储队列，但存储队列稍后不再提及。他们说

the store buffer maintains the ordering of the stores and allows stores to be performed only after all previous instructions have been completed

他们的存储缓冲区模型与 Mike Johnson 的模型相同。在约翰逊的书(超标量微处理器设计)中，存储首先以获取顺序进入存储预留站。从那里，它们被发送到地址单元，并从地址单元将它们连同相应的数据一起写入“存储缓冲区”。负载转发是通过这个存储缓冲区处理的。再一次，我认为这种结构称为存储队列。在引用文献#2 中，作者还提到

The Alpha 21264 microprocessor has a 32-entry speculative store buffer where a store remains until it is retired."

我看了一篇关于 Alpha 21264 的论文，其中指出

Stores first transfer their data across the data buses into the speculative store buffer. Store data remains in the speculative store buffer until the stores retire. Once they retire, the data is written into the data cache on idle cache cycles.

还，

The internal memory system maintains a 32-entry load queue (LDQ) and a 32-entry store queue (STQ) that manages the references while they are in-flight. [...] Stores exit the STQ in fetch order after they retire and dump into the data cache. [...] The STQ CAM logic controls the speculative data buffer. It enables the bypass of speculative store data to loads when a younger load issues after an older store.

因此，听起来在 Alpha 21264 中有一个存储队列，它以获取顺序保存有关存储指令的一些信息，但它不保留存储指令的数据。存储指令的数据保存在存储缓冲区中。

所以，在这一切之后，我不确定什么是存储缓冲区。它只是存储队列的辅助结构，还是存储等待写入 L1 的数据的完全不同的结构。或者是别的什么？我觉得有些作者说“存储缓冲区”时的意思是“存储队列”。有任何想法吗？

最佳答案

This is in line with what I explained above, but then it conflicts with the 'store buffer' in the first quote.

确实没有冲突，您的理解似乎与他们在论文中使用这些术语的方式一致。让我们仔细阅读作者所说的话。

SSB eliminates the non-scalable associative search of conventional store buffers...

存储缓冲区保存已停用但尚未写入 L1 缓存的存储。这必然意味着任何后来发布的加载相对于存储缓冲区中的任何存储在程序顺序上都更年轻。所以要检查加载的目标缓存行的最新值是否还在存储缓冲区中，只需通过加载地址搜索存储缓冲区即可。可以有零个与负载匹配的存储，也可以只有一个存储。也就是说，匹配的商店不能超过一个。在存储缓冲区中，出于转发的目的，您只需要跟踪最后存储到缓存行(如果有)并仅与该缓存行进行比较。这与我将在稍后讨论的存储队列形成对比。

...by forwarding processor-visible/speculative values to loads directly from the L1 cache.

在作者提出的架构中，存储缓冲区和 L1 缓存不在相干域中。 L2 是相干域中的第一个结构。因此，L1 包含私有(private)值，作者使用它来转发数据。

We use "store queue" to refer to storage that holds stores’ values prior to retirement and "store buffer" to refer to storage containing retired store values prior to their release to memory.

由于存储队列中保存着尚未退役的存储，因此在将负载与存储队列进行比较时，需要检查队列中每个存储的地址和年龄。然后从比针对同一位置的负载更旧的最年轻存储转发该值。

您引用的论文的目标是找到一种有效的方法来增加存储缓冲区的容量。它只是不对存储队列进行任何更改，因为这不在工作范围内。然而，还有一个 paper而是针对存储队列。

a store buffer is a mechanism that exists in many current processors to accomplish one or more of the following: store access ordering, latency hiding and data forwarding.

这些特性适用于存储缓冲区和存储队列。使用存储缓冲区(和队列)是提供这些功能的最常见方式，但还有其他方式。

不过，一般来说，这些术语可能被不同的作者或供应商用来指代不同的事物。例如，在 Intel 手册中，只使用了存储缓冲区术语，它同时包含未退休和退休但尚未提交的存储(显然，实现比仅缓冲区复杂得多)。事实上，可以为两种存储都使用一个缓冲区，并使用一个标志来区分它们。在 AMD 手册中，术语存储缓冲区、存储队列和写入缓冲区可互换使用，指代与英特尔所谓的存储缓冲区相同的东西。尽管术语写缓冲区在其他上下文中确实具有特定含义。如果您阅读的文档使用了这些术语中的任何一个而没有对其进行定义，那么您必须从上下文中弄清楚它们是如何使用的。在您引用的那篇特定论文中，这两个术语已被精确定义。无论如何，我知道很容易混淆，因为我去过那里。

关于cpu-architecture - 存储队列和存储缓冲区有什么区别？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24975540/

27

4

0

文章推荐： entity-framework - Entity Framework 通用存储库生命周期

文章推荐： entity-framework - Entity Framework 中的模型兼容性异常

文章推荐： yii - Yii 2 中的应用程序文件重组

实例讲解JQuery中this和$(this)区别
平时很少在jquery中用到this。查看代码时发现用到了，就调试出this的值，心想原来如此。还是挺有用的。这里总结一下this与$(this)的区别和使用。　　$(this)生成的是什么？
jsf - Java单例类与JSF应用程序范围的托管bean - 区别？
使用单例类和应用程序范围的托管 bean 来保存应用程序数据有区别吗？我需要查找某些 JNDI 资源，例如远程 bean 接口(interface)，因此我为自己编写了一个单例来缓存我的引用并且只允
Groovy - 闭包与方法 - 区别
如果您仔细查看包含的图片，您会注意到您可以使用 Eclipse IDE 重构 Groovy 代码并将方法转换为闭包，反之亦然。那么，闭包到底是什么，它与方法有什么不同呢？有人可以举一个使用闭包的好例子
打包和重新打包之间的 Vagrant 区别
vagrant box repackage有什么区别( docs ) 和 vagrant package ( docs )？我意识到 vagrant package仅适用于 VirtualBox 提
Java BigDecimal 区别
我想看看是否有人可以解释为什么以下代码适用于 valueOf 但不适用于其他代码。 import java.math.BigDecimal; public class Change { publ
closures - 闭包与匿名函数(区别？)
这个问题已经有答案了: 已关闭12 年前。 Possible Duplicates: What is Closures/Lambda in PHP or Javascript in layman te
docker - Docker和Chef工会，区别
This question already has answers here: Vagrant, Docker, Puppet, Chef (3个答案) 2年前关闭。 docker和chef有什么共同
c# - 调试和发布之间的C#区别
以下代码在95％的机器上产生相同的输出，但是在几台机器上却有所不同。在 Debug模式下，输出: Changing from New to Fin OK 但在 Release模式下: Changing
javascript - 创建一个对象和初始化一个对象 - 区别
////Creating Object var Obj; // init Object Obj= {}; 它们之间有什么区别两个？有没有可能把它变成一个单行？这样使用有什么好处吗？
java - 程序定时器和自动定时器 - 区别
我想找出定时器服务之间的区别。我应该使用哪个以及何时使用。我正在使用 Jboss 应用服务器。 1) java.ejb.Schedule。 @Schedule注解或配置自xml。 2) javax.e
将对象传递给它时方法签名之间的 C++ 区别
我发现在 C++ 中可以通过三种不同的方式将对象传递给函数。假设我的类(class)是这样的: class Test { int i; public: Test(int x);
java - 字符串到对象类型转换 - 区别
有什么区别。 public class Test { public static void main(String args[]) { String toBeCast = "c
MYSQL 自动增加一列或只有一个整数，区别？
如果我有一列，设置为主索引，设置为INT。如果我不将其设置为自动递增，而只是将唯一的随机整数插入其中，与自动递增相比，这是否会减慢 future 的查询速度？如果我在主索引和唯一索引为 INT 的
ios - NSDateFormatter 区别
这两种日期格式有什么区别。第一个给出实际时间，第二个给出时间购买添加时区偏移值。 NSDateFormatter * dateFormatter = [[NSDateFormatter alloc]
javascript - 调用函数与返回函数调用 - 区别？
如果有一个函数，请说foo: function foo() { console.log('bar'); } 那么在 JavaScript 中，从另一个函数调用一个函数有什么区别，如下所示: f
javascript - 使用更具体的模块导入有什么好处/区别？
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 4 年前。 Improv
一些构造函数代码之间的 C++ 区别
代码是什么: class Time { private: int hours; int minutes; int seconds; pu
两个数组声明之间的 C++ 区别
我知道这是非常基本的，但有人介意解释一下这两个数组声明之间的区别吗: #include array myints; ...和: int myints[5]; ...以及为什么 myints.size
伪类和伪元素在特异性计算中的 CSS 区别？
我学会了如何根据 http://reference.sitepoint.com/css/specificity 计算 css 特异性但是，基于this reference，我不明白伪类(来自c)和伪元
何时使用括号之间的 Linux 区别
为什么在运行 2) 时会出现额外的空行？对我来说 1 就像 2。那么为什么 2) 中的额外行？ 1) export p1=$(cd $(dirname $0) && pwd) #

首页

博学

6Ren·AI

商城

cpu-architecture - 存储队列和存储缓冲区有什么区别？