multithreading - `xchg` 是否包含 `mfence` 假设没有非时间指令？-6ren

multithreading - `xchg` 是否包含 `mfence` 假设没有非时间指令？

转载作者：行者123 更新时间：2023-12-04 12:03:09

25

4

我已经看过 this answer和 this answer ，但对于 mfence 的等价或不等价，两者似乎都没有明确和明确的说明。和 xchg在没有非时间指令的假设下。

英特尔 instruction reference为 xchg提到这条指令对于实现信号量或类似的数据结构用于进程同步很有用，并进一步引用了 Volume 3A 的第 8 章。 .该引用资料说明如下。

For the P6 family processors, locked operations serialize all outstanding load and store operations (that is, wait for them to complete). This rule is also true for the Pentium 4 and Intel Xeon processors, with one exception. Load operations that reference weakly ordered memory types (such as the WC memory type) may not be serialized.

mfence文件声称如下。

Performs a serializing operation on all load-from-memory and store-to-memory instructions that were issued prior the MFENCE instruction. This serializing operation guarantees that every load and store instruction that precedes the MFENCE instruction in program order becomes globally visible before any load or store instruction that follows the MFENCE instruction. 1 The MFENCE instruction is ordered with respect to all load and store instructions, other MFENCE instructions, any LFENCE and SFENCE instructions, and any serializing instructions (such as the CPUID instruction). MFENCE does not serialize the instruction stream.

如果我们忽略弱排序的内存类型， xchg(这意味着 lock )是否包含 mfence 对内存排序的所有保证？

最佳答案

假设您没有编写设备驱动程序 (所以所有的内存都是写回，而不是弱序写组合)，然后 是 xchg强如mfence .

NT商店很好。

我确信当前硬件就是这种情况，并且相当肯定的是，所有 future x86 CPU 的手册中的措辞都可以保证这一点。 xchg是一个非常强大的全内存屏障。

嗯，我没有看过预取指令重新排序。这可能与性能有关，甚至可能与奇怪的设备驱动程序情况下的正确性有关(您可能不应该使用可缓存的内存)。

从你的报价:

(P4/Xeon) Load operations that reference weakly ordered memory types (such as the WC memory type) may not be serialized.

这就是 xchg [mem] 的一件事弱于 mfence (在 Pentium4 上？可能也在 Sandybridge 系列上)。
mfence确实保证了这一点，这就是 Skylake 必须加强它以修复错误的原因。 ( Are loads and stores the only instructions that gets reordered? ，以及您在 Does lock xchg have the same behavior as mfence? 上链接的答案)

NT 商店由 xchg 序列化/ lock ，它只是可能无法序列化的弱排序加载。 您不能从 WB 内存中执行弱排序加载 . movntdqa xmm, [mem]在 WB 内存上仍然是强排序的(并且在当前的实现中，也忽略了 NT 提示而不是做任何事情来减少缓存污染)。

它看起来像 xchg对于 seq-cst 存储，性能优于 mov + mfence在当前的 CPU 上，所以你应该在普通代码中使用它。 (您不能意外地映射 WC 内存；正常的操作系统将始终为您提供 WB 内存用于正常分配。WC 仅用于视频 RAM 或其他设备内存。)

这些保证是根据英特尔微架构的特定系列规定的。如果我们可以为 future 的 Intel 和 AMD CPU 假设一些常见的“基线 x86”保证，那就太好了。

我假设但尚未检查 xchg对比 mfence AMD 的情况也是一样。我确定使用 xchg 没有正确性问题作为 seq-cst 存储，因为这就是 gcc 以外的编译器实际所做的。

关于multithreading - `xchg` 是否包含 `mfence` 假设没有非时间指令？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51975867/

25

4

0

文章推荐： Haskell 类型检查和确定性

文章推荐： r - 单个运行的 R Shiny 应用程序的多个 session 之间的交互

.net - 非 COM、非 .NET DLL 的正确名称？
在 Windows 世界中，什么是正确的名称。具有导出函数的老式 C++ DLL？不是 COM DLL，也不是 .NET DLL。我们以前通过调用 LoadLibrary() 和 GetProcAdd
java - 当(非 Web、非 JSF)事件调用时，需要更新浏览器上的数据
目前我正在使用javaEE7，我有一个场景如下。在我的 JSF Web 应用程序中，我有一个事件监听器(不是 JSF 事件)，当事件调用时，它会执行某些操作，然后将这些信息更新到我的 Web 应用程序
callback - 如何在 Dojo 中的另一个函数(非 AJAX)完成后调用一个函数(非 AJAX)？
这不是 AJAX 请求/响应回调问题... 我正在使用 Dojo 1.5 构建网格。我正在尝试 dojo.connect具有功能的扩展/收缩按钮。我的问题是 grid.startup()在创建实际 D
javascript - 如何通过 JavaScript 检测旧 Opera(非 Webkit，非 Next，版本 14-)
非 Webkit Opera 是 very specific在某些功能中，因此通常通过 JavaScript 检测到 the following way . 但是，Opera Next 几乎是 Goo
node.js - 如何在 couchbase 日志中查找传入请求的 IP 地址？ (非 REST API - 非 Web 控制台请求)
我已查看以下链接中给出的所有日志，但未能找到 IP 地址: https://developer.couchbase.com/documentation/server/3.x/admin/Misc/Tr
android - 如何使 Android Gradle 构建依赖于提供 jar 文件的简单(非 android 库，非 java)任务？
我有一个命令行程序，它根据一组源文件生成一个我想在我的 Android gradle 构建 (A) 中使用的 jar 文件。这个命令行程序只是将一个 jar 文件存储在磁盘上的一个目录中。我如何创建
linux - 将 http 非 www 转移到 http www，并将 https 非 www 转移到 https www
下面的 htaccess 命令将所有非 www 转移到 http www RewriteEngine On RewriteCond %{HTTP_HOST} !^www\. RewriteRule ^
linker - 非.bss未初始化数据部分
我正在使用自定义链接器脚本将内核镜像分为两部分。第一个是普通代码和数据，第二个是初始化代码和不再需要时将被丢弃的数据。初始化部分也不像内核本身那样在地址空间之间共享，因此如果 fork() 仍然存在(
c++ - "+ +"运算符的含义(非++)
这个问题在这里已经有了答案: Several unary operators in C and C++ (3 个答案) What is the "-->" operator in C++? (29
c++ - 非 final方法去虚拟化
假设我有一个类设置如下: class A { public: virtual void foo() { printf("default implementation\n"); } }; c
c++ - 非(~)与否定(!)
#include using namespace std; int main(int argc, char *argv[]) { int i=-5; while(~(i)) {
非“官网”的网站要如何才不会被百度降权
近期，百度搜索引擎变化无常，很多企业站、行业站、门户站、论坛等站点遭到了降权，特别是比比贴分类信息网直接遭到了拔毛，这对于广大站长来说是一种打击，也是各个企业、行业的打击。至今，很多网站已经恢复
TPM 非 volatile 内存大小？
我现在正在使用 IBM TPM v1332 + IBM TSS v1470 并尝试将一些基本关键字/密码存储到 TPM 上的非 volatile 内存中。我找到了两种方法。一种是创建一个密封对象并使用
php - 非 ASCII 情况下的正则表达式单词边界
我的 PHP 脚本中有一个正则表达式，如下所示: /(\b$term|$term\b)(?!([^)/iu 这与 $term 中包含的单词匹配，只要前后有单词边界并且它不在 HTML 标记内即可。但
.net - 获取远程名称地址(非 IP)
我想显示用户名称地址(请参阅 www.ipchicken.com )，但我唯一能找到的是 IP 地址。我尝试了反向查找，但也没有用: IPAddress ip = IPAddress.Parse(th
.net - 非 UI 线程可以显示在屏幕上吗？
只有 UI 线程能够显示到屏幕上，还是其他线程也可以这样做？最佳答案不，您只能直接从 UI 线程访问 UI，但您可以编码来自其他线程的结果，例如使用 Control.Invoke 或 contro
excel - 非 ActiveX 滚动条更改事件？
我正在使用现代 Excel 滚动条(不是旧的 ActiveX 类型，即开发人员 > 插入 > 表单控件 > 滚动条)并且想检测它的值何时更改。我找不到有关此类对象的更改事件的任何信息。您可以在单击时分
css - 非 IE 时使用样式表
当我使用这段代码时 IE 6 确实正确使用了指定的样式表，但所有其他浏览器在应该使用基本上声明的样式表时会忽略这两种样式表，如果您不是 IE，请使用此样式表。有什么想法吗？最佳答案 n
loopbackjs - 非 id 字段上的环回关系
我想指定 2 mssql 表之间的关系。付款类别和付款。 paymentcategory.id 加入 payout.category 列。在 payout.json 模型中我指定为外键:id，
vba - 非 volatile UDF总是重新计算
我正在尝试制作非 volatile UDF，但似乎不可能。因此，这是我非常简单的test-UDF: Option Explicit Dim i As Integer Sub Main() i = 0

首页

博学

6Ren·AI

商城

multithreading - `xchg` 是否包含 `mfence` 假设没有非时间指令？