- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图了解 CPU 管道的“获取”阶段如何与内存交互。
假设我有这些说明:
4: bb 01 00 00 00 mov $1,%ebx
9: bb 02 00 00 00 mov $2,%ebx
e: b3 03 mov $3,%bl
如果 CPU1 将 00 48 c7 c3 04 00 00 00
写入内存地址 8(即 64 位对齐)而 CPU2 正在执行这些相同的指令,会发生什么情况?指令流会自动从 2 条指令变为 1 条指令,如下所示:
4: bb 01 00 00 00 mov $1,%ebx
9: 48 c7 c3 04 00 00 00 mov $4,%rbx
由于 CPU1 写入的内存与 CPU2 读取的内存相同,因此存在争用。写入会导致 CPU2 流水线在刷新其 L1 缓存时停止吗?假设 CPU2 刚刚完成了 mov $2
的“获取”pĥase,为了重新获取更新的内存,它会被丢弃吗?
此外,将 2 条指令更改为 1 条指令时还存在原子性问题。
我找到了这个 quite old document提到“指令获取单元在每个时钟周期从指令缓存存储器中获取一个 32 字节缓存行”我认为这可以解释为每条指令都从 L1 获取缓存行的新副本,即使它们共享相同的缓存行。但我不知道这是否/如何适用于现代 CPU。
如果以上是正确的,这意味着在将 mov $2
提取到管道后,下一次提取可能会在地址 e
处获取更新后的值并尝试执行 00 00
(add %al,(%rax)
) 这可能会失败。
但是如果 mov $2
的获取将 mov $3
带入“指令缓存”,它会不会认为下一次获取只是从该缓存中获取指令(并返回 mov $3
)而不重新查询 L1 是否有意义?这将有效地使这 2 条指令的提取成为原子操作,只要它们共享一条高速缓存行即可。
那是什么?基本上有太多未知数,太多我只能推测,所以我非常感谢逐个时钟周期的分割,了解管道的 2 个获取阶段如何与它们访问的内存交互(更改)。
最佳答案
正如 Chris 所说,RFO(Read For Ownership)可以随时使 I-cache 行无效。
根据超标量获取组的排列方式,在 9:
获取 5 字节 mov
之间,但在获取下一条指令之前,缓存行可能会失效在 e:
。
当获取最终发生时(该核心再次获取缓存行的共享副本),RIP = e
并且它将获取 mov $4,%rbx< 的最后 2 个字节
。 交叉修改代码需要确保没有其他内核在它要编写一条长指令的中间执行。
在这种情况下,您将得到 00 00
add %al, (%rax)
。
另请注意,写入 CPU 需要确保修改是原子的,例如使用 8 字节存储(Intel P6 和更高版本的 CPU 保证在 1 个缓存行内的任何对齐处存储最多 8 个字节是原子的;AMD 没有),或者 lock cmpxchg
或 lock cmpxchg16b
。否则,读者可能会看到部分更新的说明。您可以将指令获取视为执行原子 16 字节加载或类似操作。
"The instruction fetch unit fetches one 32-byte cache line in each clock cycle from the instruction cache memory" which I think can be interpreted to mean that each instruction gets a fresh copy of the cache line from L1,
没有。
那个宽取 block 然后被解码成多个 x86 指令! wide fetch 的要点是一次拉入多条指令,而不是每条指令分别重做。该文档似乎是关于 P6 (Pentium III) 的,尽管 P6 一次只执行 16 个字节的实际提取,进入一个 32 字节宽的缓冲区,让 CPU 占用一个 16 字节的窗口。
P6 是 3-wide 超标量,每个时钟周期最多可以解码包含最多 3 条指令的 16 字节机器码。 (但是有一个预解码阶段首先找到指令长度......)
有关详细信息,请参阅 Agner Fog 的微架构指南 (https://agner.org/optimize/),(重点是与提高软件性能相关的细节。)后来的微架构在预解码和解码之间添加了队列。请参阅 Agner Fog 的微架构指南的那些部分,以及 https://realworldtech.com/merom/ (核心 2)。
当然请参阅 https://realworldtech.com/sandy-bridge对于带有 uop 缓存的更现代的 x86。还有 https://en.wikichip.org/wiki/amd/microarchitectures/zen_2#Core对于最近的 AMD。
在阅读任何这些内容之前,为了获得良好的背景,Modern Microprocessors: A 90-Minute Guide! .
对于修改自己代码的核心,参见:Observing stale instruction fetching on x86 with self-modifying code - 这是不同的(而且更难),因为必须从程序顺序中较早指令与较晚指令的代码提取中整理出存储的无序执行。也就是说,商店必须变得可见的时刻是固定的,不像另一个核心,它只是在它发生时发生。
关于assembly - 当带有指令的内存被另一个内核更改时,CPU 流水线会发生什么情况?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67988744/
尝试使用集成到 QTCreator 的表单编辑器,但即使我将插件放入 QtCreator.app/Contents/MacOS/designer 也不会显示。不过,相同的 dylib 文件确实适用于独
在此代码示例中。 “this.method2();”之后会读到什么?在返回returnedValue之前会跳转到method2()吗? public int method1(int returnedV
我的项目有通过gradle配置的依赖项。我想添加以下依赖项: compile group: 'org.restlet.jse', name: 'org.restlet.ext.apispark', v
我将把我们基于 Windows 的客户管理软件移植到基于 Web 的软件。我发现 polymer 可能是一种选择。 但是,对于我们的使用,我们找不到 polymer 组件具有表格 View 、下拉菜单
我的项目文件夹 Project 中有一个文件夹,比如 ED 文件夹,当我在 Eclipse 中指定在哪里查找我写入的文件时 File file = new File("ED/text.txt"); e
这是奇怪的事情,这个有效: $('#box').css({"backgroundPosition": "0px 250px"}); 但这不起作用,它只是不改变位置: $('#box').animate
这个问题在这里已经有了答案: Why does OR 0 round numbers in Javascript? (3 个答案) 关闭 5 年前。 Mozilla JavaScript Guide
这个问题在这里已经有了答案: Is the function strcmpi in the C standard libary of ISO? (3 个答案) 关闭 8 年前。 我有一个问题,为什么
我目前使用的是共享主机方案,我不确定它使用的是哪个版本的 MySQL,但它似乎不支持 DATETIMEOFFSET 类型。 是否存在支持 DATETIMEOFFSET 的 MySQL 版本?或者有计划
研究 Seam 3,我发现 Seam Solder 允许将 @Named 注释应用于包 - 在这种情况下,该包中的所有 bean 都将自动命名,就好像它们符合条件一样@Named 他们自己。我没有看到
我知道 .append 偶尔会增加数组的容量并形成数组的新副本,但 .removeLast 会逆转这种情况并减少容量通过复制到一个新的更小的数组来改变数组? 最佳答案 否(或者至少如果是,则它是一个错
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
noexcept 函数说明符是否旨在 boost 性能,因为生成的对象中可能没有记录异常的代码,因此应尽可能将其添加到函数声明和定义中?我首先想到了可调用对象的包装器,其中 noexcept 可能会产
我正在使用 Angularjs 1.3.7,刚刚发现 Promise.all 在成功响应后不会更新 angularjs View ,而 $q.all 会。由于 Promises 包含在 native
我最近发现了这段JavaScript代码: Math.random() * 0x1000000 10.12345 10.12345 >> 0 10 > 10.12345 >>> 0 10 我使用
我正在编写一个玩具(物理)矢量库,并且遇到了 GHC 坚持认为函数应该具有 Integer 的问题。是他们的类型。我希望向量乘以向量以及标量(仅使用 * ),虽然这可以通过仅使用 Vector 来实现
PHP 的 mail() 函数发送邮件正常,但 Swiftmailer 的 Swift_MailTransport 不起作用! 这有效: mail('user@example.com', 'test
我尝试通过 php 脚本转储我的数据,但没有命令行。所以我用 this script 创建了我的 .sql 文件然后我尝试使用我的脚本: $link = mysql_connect($host, $u
使用 python 2.6.4 中的 sqlite3 标准库,以下查询在 sqlite3 命令行上运行良好: select segmentid, node_t, start, number,title
我最近发现了这段JavaScript代码: Math.random() * 0x1000000 10.12345 10.12345 >> 0 10 > 10.12345 >>> 0 10 我使用
我是一名优秀的程序员,十分优秀!