winapi - 原子 x86 指令与 MS 的 InterlockedCompareExchange 文档的对齐要求？-6ren

winapi - 原子 x86 指令与 MS 的 InterlockedCompareExchange 文档的对齐要求？

转载作者：行者123 更新时间：2023-12-03 01:36:39

25

4

Microsoft 提供 InterlockedCompareExchange用于执行原子比较和交换操作的函数。还有一个_InterlockedCompareExchange 内在。

在 x86 上，这些是使用 lock cmpxchg 指令实现的。

但是，通读这三种方法的文档后，他们似乎在对齐要求上并不一致。

英特尔的reference manual没有提及对齐(除了如果启用了对齐检查并且进行了未对齐的内存引用，则会生成异常)

我还查找了 lock 前缀，其中明确指出

The integrity of the LOCK prefix is not affected by the alignment of the memory field.

(强调我的)

所以英特尔似乎说对齐是无关紧要的。无论如何，该操作都是原子的。

_InterlockedCompareExchange 内部文档也没有提及对齐，但是 InterlockedCompareExchange 函数指出

The parameters for this function must be aligned on a 32-bit boundary; otherwise, the function will behave unpredictably on multiprocessor x86 systems and any non-x86 systems.

那么什么给出了呢？InterlockedCompareExchange 的对齐要求是否只是为了确保该函数即使在 cmpxchg 指令不可用的 486 之前的 CPU 上也能正常工作？根据上述信息，这似乎是可能的，但我想在依赖它之前确定一下。 :)

或者 ISA 是否需要对齐来保证原子性，而我只是在英特尔引用手册中查找了错误的位置？

最佳答案

x86 不要求将lock cmpxchg 指令对齐为原子指令。然而，为了获得良好的性能，对齐是必要的。

这应该不足为奇，向后兼容性意味着 14 年前使用手册编写的软件仍然可以在今天的处理器上运行。现代 CPU 甚至有一个专门用于分割锁检测的性能计数器，因为它非常昂贵。 (核心不能在操作期间仅保留对单个缓存行的独占访问；它必须执行类似于传统总线锁定的操作)。

微软究竟为何记录对齐要求尚不清楚。这对于支持 RISC 架构当然是必要的，但多处理器 x86 上的不可预测行为的具体声明甚至可能是无效的。 (除非它们意味着不可预测的性能，而不是正确性问题。)

您猜测仅适用于没有 lock cmpxchg 的 486 之前的系统可能是正确的；那里需要一种不同的机制，这可能需要某种围绕纯加载或纯存储的锁定。 (另请注意，486 cmpxchg 具有与 currently-undocumented opcode 不同的 modern cmpxchg (0f b1) (0f a7)，后者是 586 Pentium 中新增的；Windows 可能只使用 cmpxchg 在 P5 Pentium 及更高版本上，我不知道。)这也许可以解释某些 x86 上的奇怪现象，但并不意味着现代 x86 上的奇怪现象。

Intel® 64 and IA-32 Architectures Software Developer’s Manual
Volume 3 (3A): System Programming Guide
January 2013

8.1.2.2 Software Controlled Bus Locking

To explicitly force the LOCK semantics, software can use the LOCK prefix with the following instructions when they are used to modify a memory location. [...]

• The exchange instructions (XADD, CMPXCHG, and CMPXCHG8B).
• The LOCK prefix is automatically assumed for XCHG instruction.
• [...]

[...] The integrity of a bus lock is not affected by the alignment of the memory field. The LOCK semantics are followed for as many bus cycles as necessary to update the entire operand. However, it is recommend that locked accesses be aligned on their natural boundaries for better system performance:

• Any boundary for an 8-bit access (locked or otherwise).
• 16-bit boundary for locked word accesses.
• 32-bit boundary for locked doubleword accesses.
• 64-bit boundary for locked quadword accesses.

<小时/>

有趣的事实:cmpxchg without a lock prefix is still atomic wrt. context switches ，因此可用于单核系统上的多线程。

即使未对齐，它仍然是原子的。中断(完全之前或完全之后)，并且只有其他设备(例如 DMA)的内存读取才能看到撕裂。但此类访问也可以看到加载和存储之间的分离，因此即使旧 Windows 确实在单核系统上使用它来实现更高效的 InterlockedCompareExchange，它仍然不需要正确性对齐，只需要性能对齐。如果这可以用于硬件访问，Windows 可能不会这样做。

如果库函数需要执行与锁定 cmpxchg 分开的纯加载，这可能有意义，但不需要这样做。 (如果不内联，32 位版本必须从堆栈加载其参数，但这是私有(private)的，无法访问共享变量。)

关于winapi - 原子 x86 指令与 MS 的 InterlockedCompareExchange 文档的对齐要求？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1415256/

25

4

0

文章推荐： lync - 是否可以强制 Lync 立即保存对话历史记录？

文章推荐： vba - 如何在 MS Office VBA 编辑器中查看变量的类型？

文章推荐： vba - Excel VBA : How To Remove Duplicate Values From Table?

文章推荐： vba - 删除多个单元格中的文本

html - 对齐/对齐 li 网格元素
我希望能够像在 jsFiddle 中那样将元素列表对齐到右侧的复选框。这是如何做到这一点的最佳实践？传统上我从来没有 float 过相互嵌套的元素，所以我想确定这是否是解决此问题的正确方法。代码(h
assembly - MIPS assembly 对齐对齐 n
指令.align n是什么意思在数组中做什么？更具体地说，假设我有以下部分代码: array: .align 2 .space 800 它的重要性是什么，为什么不跳过它并使用
c - 强制 2 函数对齐的幂 s.t 对齐 % 一些其他值 == 对齐
基本上我正在寻找一种强制特定相对对齐的方法即我想保证其他一些值(value) m s.t m > n alignment_of(foo) % 2^m == 2^n IE: .align 2^m; .
多维数组结构的C++对齐
在我的代码中，我必须考虑一个数组数组，其中内部数组具有固定维度。为了使用 STL 算法，将数据实际存储为数组的数组很有用，但我还需要将该数据传递给 C 库，该库采用扁平化的 C 样式数组。如果能够以
BlackBerry HorizontalFieldManager 对齐
横向上，我想显示两个位图，并在它们之间显示一个标签字段。代码看起来很简单，但所有字段都添加在屏幕左侧。 HorizontalFieldManager hfm = new HorizontalFiel
轴标签与表达式的 R 对齐
我想绘制一个变量名称及其符号。因为某些变量的名称很长，所以我试图将换行符与轴标签混合使用。这会导致对齐中发生有趣的事情: par(mar=c(1,12,1,1)) plot( y=1:6, 1:6,
r - 将左两行图例标题与expression()对齐
使用这个脚本 df <- data.frame(x = 1:5, y = 1:5, color = letters[1:5]) ggplot(df, aes(x, y, fill = color))
matlab - 在matlab中从结构创建表 - 对齐
我有一个带有标量字段的结构，比如妈妈，我想在屏幕上对齐的列中显示结构的值，可能还有一些标题。这是一个最小的工作示例: mom.a = 1; mom.b = 2; mom.veryLongName =
ios 自动布局视觉格式 - 对齐
在 iOS6 中，我使用自动布局。我有 2 个以编程方式创建的 View v1 和 v2。 v2 作为 subview 添加到 v1 v1 的约束已通过编程方式创建(此处未显示)。我希望 v1 和
C++ 对齐 new[]
概述浏览时operator new, operator new[] - cppreference.com ，似乎我们有许多选项来分配具有特定对齐要求的对象数组。但是，没有指定如何使用它们，而且我似乎
flutter - 对两个文本小部件仅使用一次“对齐”
Widget _createProfileContainer() { return new Container( height: 64.0, child: ne
javascript - Bootstrap 对齐
我正在使用 Bootstrap 和语义 UI 的组合来设计和对齐我的网页。目前，我在将页面 api map 和博客文章在整个页面上对齐时遇到问题，而不是像图像所示那样堆叠在一起。这是我的底层代码，
Java GUI 对齐
所以我已经添加了标签和所有内容，但我仍然在格式化和对齐所有内容时遇到问题。计算按钮显然应该居中。我知道使用 gridbag 将框架分割成坐标系，当一列大于其他列时，它会调整其他列并将其抛弃(对吗？)。
java - 对齐 JButton
我必须将程序上的按钮对齐到中间，我运行的当前代码但显示的按钮与程序一样大，我想要一个特定大小的中心按钮，这是我尝试过的 /** * Created by Timk9 on 11/04/2016.
VIM 格式化/对齐
我正在尝试将 VIM 作为我的 ruby/rails 编辑器。太胖了，我对它的功能印象深刻并且我能够安装以下插件以提供更好的 IDE 体验自动配对 Better-snipmate-snippe
c++ - 对齐/偏移结构的特定成员
在结构内对齐成员的最佳或常规方法是什么？添加虚拟数组是最佳解决方案吗？我有一个 double 的结构和 double 的三倍是吗？ struct particle{ double mass;
C++ iomanip 对齐
我正在尝试对齐我的输出，但由于某种原因我无法做到我多么想要它，这真的很令人沮丧。标题不会正确对齐。我不知道我是否正确使用了 setw()。 #include using std::cout; usi
android - 对齐 TextView
我正在开发一个 android 应用程序，其相对布局如下所示。这是应用程序在屏幕上的显示方式的 imgur 链接:http://imgur.com/c4rNJ .我希望“Text 1”出现在“a l
java - 对齐 JButton
我不确定为什么我不能在下面的代码中调整按钮的位置。我有几行设置了边界，但我一定遗漏了一些东西。 public DayGUI() { mainFrame = new JF
html - 对齐 iframe
我有一个 html 页面，我想在页面底部对齐一个 iframe，使 iframe 占据所有宽度，我无法在底部对齐 iframe。请找到底部的 iframe 标签页面。 The rest of th

首页

博学

6Ren·AI

商城

winapi - 原子 x86 指令与 MS 的 InterlockedCompareExchange 文档的对齐要求？