- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设2个内核试图在同一时间(正负eta)将不同的值写入相同的RAM地址(1个字节),并且不使用任何互锁的指令或内存屏障。在这种情况下会发生什么,什么值将被写入主RAM?第一个获胜?最后一个赢了?不确定的行为?
最佳答案
x86(与其他主流SMP CPU架构一样)具有coherent data caches。两个不同的缓存(例如2个不同内核的L1D)不可能为同一缓存行保存冲突的数据。
硬件强加了一个命令(通过某种特定于实现的机制来打破联系,以防两个所有权请求在同一时钟周期内从不同的内核到达)。在大多数现代x86 CPU中,第一个存储区不会写到RAM,因为有一个共享的回写L3缓存来吸收一致性流量,而无需往返存储器。
以全局顺序在两个存储之后出现的负载将看到第二个存储所存储的值。
(我假设我们正在谈论将普通(非NT)存储存储到可缓存的内存区域(WB,而不是USWC,UC甚至是WT)。但是,在两种情况下,基本思想都是相同的; 一个存储将首先,下一步将踩到它。如果在全局顺序中碰巧在它们之间发生负载,则可以临时观察来自第一个存储的数据,否则,硬件将选择执行第2个存储的数据长期的影响。
我们正在谈论的是一个字节,因此不能将存储区拆分为两条高速缓存行,因此每个地址都自然对齐,因此Why is integer assignment on a naturally aligned variable atomic on x86?中的所有内容都适用。
一致性是通过要求核心在对其进行修改之前先获得对该缓存行的独占访问权来维护的,即(即,通过将其从商店队列提交到L1D缓存来使商店在全局范围内可见)。
使用the MESI protocol(的一种变体)可以完成这种“获取独占访问”的工作。高速缓存中的任何给定行都可以被修改(脏),排他(尚未写入),共享(干净副本;其他高速缓存也可能具有副本,因此在写入之前需要RFO(读取/请求所有权)),或无效的。 MESIF(Intel)/MOESI(AMD)添加了额外的状态来优化协议(protocol),但不要更改基本逻辑,即只有一个内核可以随时更改一条线路。
如果我们关心对两个不同行的多个更改的排序,则内存排序的内存障碍将发挥作用。但是,对于在同一时钟周期内执行或退出存储的“哪个存储赢”这个问题,这都不重要。
存储执行时,它将进入存储队列。它可以提交给L1D,并且在退休后的任何时候(但不是在此之前)都可以全局可见。未弃用的指令被视为推测性的,因此它们的体系结构效果必须在CPU内核之外不可见。投机负荷没有建筑影响,只有微建筑1。
因此,如果两个存储都准备好在“同一时间”提交(时钟不必在内核之间同步),那么另一个或另一个将使其RFO首先成功并获得独占访问权,并使其存储数据在全局可见。然后,不久之后,另一个核心的RFO将成功执行并使用其数据更新缓存行,因此其存储在所有其他核心观察到的全局存储顺序中排名第二。
x86具有总存储顺序的内存模型,其中,即使对于不同高速缓存行的存储,所有内核都遵循相同的顺序(除非始终按程序顺序查看其自己的存储)。诸如PowerPC之类的一些弱排序的体系结构将允许某些内核看到与其他内核不同的总顺序,但是这种重新排序只能在商店到不同生产线之间发生。单个高速缓存行始终只有一个修改顺序。 (关于彼此和其他存储的负载重新排序意味着您必须小心如何在弱排序的ISA上进行观察,但是MESI会对缓存行进行单一修改)。
哪一个获胜可能取决于环形总线上内核的布局(相对于该线映射到哪一部分共享L3缓存)的平庸性。 (请注意,使用“种族”一词:这是“种族条件”错误所描述的一种种族。编写代码时,两个不同步的商店更新同一位置并且您不在乎哪个会获胜,这并不总是错误的,但很少见。)
顺便说一句,当多个内核争用原子对同一高速缓存行进行原子读-修改-写操作(因此是holding onto it for multiple clock cycles to make lock add byte [rdi], 1
atomic)时,现代的x86 CPU具有硬件仲裁,但是常规加载/存储只需要在一个周期内拥有一条高速缓存行执行加载或提交存储。我认为lock
ed指令的仲裁与当多个内核试图将存储提交到同一高速缓存行时内核胜出是另一回事。除非您使用pause
指令,否则内核会假定其他内核未在修改相同的缓存行,并且以推测方式加载得较早,因此,如果确实发生了内存排序错误推测,则将遭受痛苦。 (What are the latency and throughput costs of producer-consumer sharing of a memory location between hyper-siblings versus non-hyper siblings?)
如果两个线程都只是在不加载的情况下进行存储,则可能发生IDK,这可能是因为没有对存储进行非推测性的重新排序,并且由于存储队列将它们与乱序执行分离开来,所以发生了IDK。一旦存储指令退出,存储肯定会发生,因此OoO执行人员不必等待其实际提交。 (实际上,它必须先从OoO内核中退出,然后才能提交,因为这是CPU知道它是非推测性的;即,没有更早的指令出错或分支预测错误)
脚注:
关于multithreading - 当不同的CPU内核在不同步的情况下写入同一RAM地址时会发生什么情况?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48817022/
我是 Java 新手,这是我的代码, if( a.name == b.name && a.displayname == b.displayname && a.linknam
在下面的场景中,我有一个 bool 值。根据结果,我调用完全相同的函数,唯一的区别是参数的数量。 var myBoolean = ... if (myBoolean) { retrieve
我是一名研究 C++ 的 C 开发人员: 我是否正确理解如果我抛出异常然后堆栈将展开直到找到第一个异常处理程序?是否可以在不展开的情况下在任何 throw 上打开调试器(即不离开声明它的范围或任何更高
在修复庞大代码库中的错误时,我观察到一个奇怪的情况,其中引用的动态类型从原始 Derived 类型更改为 Base 类型!我提供了最少的代码来解释问题: struct Base { // some
我正在尝试用 C# 扩展给定的代码,但由于缺乏编程经验,我有点陷入困境。 使用 Visual Studio 社区,我尝试通过控制台读出 CPU 核心温度。该代码使用开关/外壳来查找传感器的特定名称(即
这可能是一个哲学问题。 假设您正在向页面发出 AJAX 请求(这是使用 Prototype): new Ajax.Request('target.asp', { method:"post", pa
我有以下 HTML 代码,我无法在所有浏览器中正常工作: 我试图在移动到
我对 Swift 很陌生。我如何从 addPin 函数中检索注释并能够在我的 addLocation 操作 (buttonPressed) 中使用它。我正在尝试使用压力触摸在 map 上添加图钉,在两
我设置了一个详细 View ,我是否有几个 Nib 文件根据在 Root View Controller 的表中选择的项目来加载。 我发现,对于 Nibs 的类,永远不会调用 viewDidUnloa
我需要动态访问 json 文件并使用以下代码。在本例中,“bpicsel”和“temp”是变量。最终结果类似于“data[0].extit1” var title="data["+bpicsel+"]
我需要使用第三方 WCF 服务。我已经在我的证书存储中配置了所需的证书,但是在调用 WCF 服务时出现以下异常。 向 https://XXXX.com/AHSharedServices/Custome
在几个 SO 答案(1、2)中,建议如果存在冲突则不应触发 INSERT 触发器,ON CONFLICT DO NOTHING 在触发语句中。也许我理解错了,但在我的实验中似乎并非如此。 这是我的 S
如果进行修改,则会给出org.hibernate.NonUniqueObjectException。在我的 BidderBO 类(class)中 @Override @Transactional(pr
我使用 indexOf() 方法来精细地查找数组中的对象。 直到此刻我查了一些资料,发现代码应该无法正常工作。 我在reducer中尝试了上面的代码,它成功了 let tmp = state.find
假设我有以下表格: CREATE TABLE Game ( GameID INT UNSIGNED NOT NULL, GameType TINYINT UNSIGNED NOT NU
代码: Alamofire.request(URL(string: imageUrl)!).downloadProgress(closure: { (progress) in
我是一名优秀的程序员,十分优秀!