x86 - 现代 x86 CPU 使用什么缓存一致性解决方案？-6ren

x86 - 现代 x86 CPU 使用什么缓存一致性解决方案？

转载作者：行者123 更新时间：2023-12-03 21:54:06

26

4

我对缓存一致性系统在现代多核 CPU 中的功能有些困惑。我已经看到基于监听的协议(protocol)，如基于 MESIF/MOESI 监听的协议(protocol)已在 Intel 和 AMD 处理器中使用，另一方面，基于目录的协议(protocol)似乎对多核更有效，因为它们不广播，而是将消息发送到具体节点。

什么是 AMD 或 Intel 处理器中的现代缓存一致性解决方案，它是基于监听的协议(protocol)，如 MOESI 和 MESIF，还是仅基于目录的协议(protocol)，还是两者的组合(基于监听的协议(protocol)，用于同一节点内的元素之间的通信？，以及基于节点到节点通信的目录)？

最佳答案

MESI 是根据监听共享总线来定义的，但不，现代 CPU 实际上并不是这样工作的。每个缓存行的 MESI 状态可以通过消息和监听过滤器(基本上是一个目录)来跟踪/更新，以避免广播这些消息，这正是 Intel (MESIF) 和 AMD (MOESI) 实际所做的。
例如Intel CPU (before Skylake server) 中的共享包容性 L3 缓存让 L3 标签充当监听过滤器；除了跟踪 MESI 状态外，它们还会记录哪个内核 #(如果有)拥有一行的私有(private)副本。 Which cache mapping technique is used in intel core i7 processor?
例如，带有环形总线的 Sandybridge 系列 CPU(现代客户端芯片、服务器芯片直至 Broadwell)。核心#0 读取一行。该行在核心 #1 上处于修改状态。

在核心 #0 上的 L1d 和 L2 缓存中读取未命中，导致在环总线上向包含该行的 L3 切片发送请求(通过某些物理地址位上的哈希函数索引)

L3 的切片获取消息，检查其标签。如果此时发现 tag = Shared，则响应可以通过双向环总线返回数据。

否则，L3 标签告诉它核心 #1 拥有一行的独占所有权:独占，可能已被提升为修改 = 脏。

该 L3 切片中的

L3 缓存逻辑将生成一条消息，要求内核 #1 写回该行。

消息到达内核#1 的环形总线站，并让其L2 或L1d 回写该行。
IDK，如果一个环形总线消息可以被核心 #0 以及 L3 缓存的相关切片直接读取，或者如果消息可能必须一直到达 L3 切片，然后从那里到达核心 #0。 (最坏情况下的距离 = 基本上是围绕环，而不是双向环的一半。)

这是 super 手工波浪式的；不要在具体细节上相信我的话，但是发送诸如共享请求、RFO 或回写之类的消息的一般概念是正确的思维模型。 BeeOnRope 有 an answer，它具有类似的分解步骤，涵盖 uops 和存储缓冲区，以及 MESI/RFO。

在类似的情况下，核心 #1 可以在没有修改的情况下悄悄删除该行，如果它只是获得了独占所有权但从未写过它。 (加载缓存中的未命中默认为加载到独占状态，因此单独的存储不必为同一行执行 RFO)。在那种情况下，我认为没有线路的核心毕竟必须发回一条消息来表明这一点。或者，它可能直接向也在环形总线上的其中一个内存 Controller 发送消息，而不是返回 L3 切片以强制它这样做。
显然，每个内核都可以并行发生这样的事情。 (并且每个内核都可以有多个未完成的请求正在等待:单个内核内的内存级并行。在 Intel 上，L2 super 队列在某些微架构上有 16 个条目，而有 10 或 12 个 L1 LFB。)
四插槽和更高级别的系统在插槽之间具有监听过滤器；采用 Broadwell 和更早版本的 E5-xxxx CPU 的双插槽 Intel 系统只是通过 QPI 链接相互窥探垃圾邮件。 (除非您在双插槽系统中使用支持四插槽的 CPU (E7-xxxx))。多插槽很难，因为在本地 L3 中缺失并不一定意味着是时候使用 DRAM；/另一个套接字可能修改了该行。
还相关:

https://www.realworldtech.com/sandy-bridge/ Kanter 的 SnB 文章涵盖了一些关于 Intel 的环形总线设计 IIRC，尽管它主要是关于每个内核的内部结构。共享包容性 L3 是 Nehalem 中的新事物(当英特尔开始使用“core i7”品牌名称时)，https://www.realworldtech.com/nehalem/

Why is Skylake so much better than Broadwell-E for single-threaded memory throughput? - 对于具有更多内核的 Intel CPU，环形总线上的更多跃点会损害 L3 和 DRAM 延迟，因此带宽 = 最大并发/延迟。

What is the benefit of the MOESI cache coherency protocol over MESI? 还有一些链接。

关于x86 - 现代 x86 CPU 使用什么缓存一致性解决方案？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62114759/

26

4

0

文章推荐： apache - 在 Apache Web 服务器中设置内容安全策略

文章推荐： visual-studio-code - 是否有标准的方法来记录 Svelte 组件？

visual-studio-2010 - Visual Studio 2010 Professional 解决方案/项目是否与 Visual Studio 2010 Premium 解决方案/项目 100% 兼容？
我只是想知道要安装哪个版本的 Visual Studio 2010(专业版或高级版)提示升级项目.. 项目包括:asp.net mvc、数据库和silverlight。最佳答案通常，由不同版本的相
[解决方案]几种通过iproute2来打通不同节点间容器网络的方式
几种通过 iproute2 来打通不同节点间容器网络的方式几种通过 iproute2 来打通不同节点间容器网络的方式 host-gw ipip vxlan 背景之前由于需
【解决方案】基于数据库驱动的自定义TypeHandler处理器
目录前言 1、TypeHandler 简介 1.1转换步骤 1.2转换规则 2、JSON 转换 3、枚举转换 4、文章小结
【解决方案】Java互联网项目中常见的Redis缓存应用场景
目录前言 1、常见 key-value 2、时效性强 3、计数器相关 4、高实时性 5、排行榜系列 6、文章小结前言在笔者 3 年的
【解决方案】Java互联网项目中消息通知系统的设计与实现（下）
目录前言四、技术选型五、后端接口设计 5.1业务系统接口 5.2App 端接口六、关键逻辑实现 6.1Red
【解决方案】Java互联网项目中消息通知系统的设计与实现（上）
目录前言一、需求分析 1.1发送通知 1.2撤回通知 1.3通知消息数 1.4通知消息列表二、数据模型设计
【解决方案】多租户技术架构设计入门（一）
目录前言一、多租户的概念二、隔离模式 2.1独立数据库模式 2.2共享数据库独立数据架构 2.3共享数据库共享数据架构
【解决方案】MySQL中的死锁问题还能这样解决（文末送书）
导读：虽然锁在一定程度上能够解决并发问题，但稍有不慎，就可能造成死锁。本文介绍死锁的产生及处理。死锁的产生和预防发生死锁的必要条件有4个，分别为互斥条件、不可剥夺条件、请求与保持条件和循环等待条
javascript - 获取波斯月的最后一天 + 解决方案
在浏览网页后，我找不到任何功能来执行此操作，我有可行的个人解决方案。也许它对某人有用。 **使用 Moment 插件转换日期。***moment(currentPersianDate).clone()
检测数字手写的 OCR 解决方案？
是否有一种解决方案可以很好地处理数字(1-10)手写？我试过tesseract，但我得到的只是垃圾。理想情况下是 OSS，但商业也可以。最佳答案 OpenCV 现在带有手写数字识别 OCR 示例。
multithreading - Delphi死锁解释/解决方案
在服务器应用程序上，我们有以下内容:一个称为 JobManager 的单例类。另一个类，Scheduler，不断检查是否需要向 JobManager 添加任何类型的作业。当需要这样做时，调度程序会执
javascript - 用于在应用程序中处理和捕获错误的工具/解决方案
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
r - 解决方案。有代理时如何install_github
当您尝试从 GitHub 存储库安装某些 R 包时 install_github('rWBclimate', 'ropensci') 如果您遇到以下错误: Installing github repo
WPF 字体模糊问题-解决方案
问题在以下链接中进行了描述和演示: Paul Stovell WPF: Blurry Text Rendering www.gamedev.net forum Microsoft Connect: W
用于科学记数格式格式化的 R 解决方案
我正在寻找一种解决方案，使用标准格式 a × 10 b 在科学记数法下格式化 R 中的数字。一些同行评审的科学期刊都要求这样做，并且手动修改图表可能会变得乏味。下面是 R 标准“E 表示法”的示例，
java - 如何从另一个java应用程序内部启动资源jar - 解决方案
已编辑解决方案(如下...) 我有一个启动画面，它被打包到它自己的 jar 中。它有效。我可以通过以下方式从另一个 java 应用程序内部调用 Splash.jar: Desktop.getDesk
用于创建门户的 .NET 解决方案
什么是创建像 PageFlakes 或 iGoogle 这样的门户网站的好框架/包？？我们希望创建一个为员工提供 HR 服务的员工/HR 门户，但我们也需要一种足够灵活的产品，以便我们可以使用它来为
用于科学记数格式格式化的 R 解决方案
我正在寻找一种解决方案，使用标准格式 a × 10 b 在科学记数法下格式化 R 中的数字。一些同行评审的科学期刊都要求这样做，并且手动修改图表可能会变得乏味。下面是 R 标准“E 表示法”的示例，
search - 解决方案+遗传
如何将 solr 与 heritrix 集成？我想使用 heritrix 归档一个站点，然后使用 solr 在本地索引和搜索该文件。谢谢最佳答案使用 Solr 进行索引的问题在于它是一个纯文本
jquery - 全日历工作时间 [解决方案]
完整日历不包含工作时间功能选项(在任何一天的议程 View 中选择第一行和最后一行 - 例如公司不工作)。我做到了类似的事情: viewDisplay: function(view){

首页

博学

6Ren·AI

商城

x86 - 现代 x86 CPU 使用什么缓存一致性解决方案？