- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
据我所知,mfence
是一个硬件内存屏障,而 asm volatile ("": : : "memory")
是一个编译器屏障。但是,可以使用 asm volatile ("": : : "memory")
来代替 mfence。
我感到困惑的原因是 this link
最佳答案
嗯,只有内存排序较弱的架构才需要内存屏障。 x86 和 x64 没有弱内存排序。在 x86/x64 上,所有存储都有释放栅栏,所有负载都有获取栅栏。所以,你应该只需要 asm volatile ("": : : "memory")
有关 Intel 和 AMD 的详细概述以及相关制造商规范的引用,请参阅 http://bartoszmilewski.com/2008/11/05/who-ordered-memory-fences-on-an-x86/
通常,像“ volatile ”这样的东西是在每个字段的基础上使用的,其中对该字段的加载和存储本身就是原子的。如果对字段的加载和存储已经是原子的(即,所讨论的“操作”是对单个字段的加载或存储,因此整个操作是原子的), volatile
字段修饰符或内存屏障x86/x64 上不需要。尽管有可移植代码。
当涉及到非原子的“操作”时——例如加载或存储到大于 native 单词的字段,或者加载或存储到“操作”内的多个字段——无论 CPU 如何,都需要一种可以将操作视为原子操作的方法建筑学。 通常这是通过诸如互斥体之类的同步原语来完成的。互斥体(我使用过的)包括内存屏障,以避免处理器重新排序等问题,因此您不必添加额外的内存屏障指令。我通常认为不使用同步原语是一种过早的优化;但是,过早优化的本质当然是 97% 的时间:)
如果您不使用同步原语并且正在处理多字段不变量,那么确保处理器不会对存储和加载到不同内存位置进行重新排序的内存屏障非常重要。
现在,不在 asm volatile 中发出“mfence”指令,而是在 clobber 列表中使用“内存”。据我所知read
If your assembler instructions access memory in an unpredictable fashion, add `memory' to the list of clobbered registers. This will cause GCC to not keep memory values cached in registers across the assembler instruction and not optimize stores or loads to that memory.
当他们说“GCC”并且没有提及任何有关 CPU 的内容时,这意味着它仅适用于编译器。缺少“mfence”意味着不存在CPU内存屏障。您可以通过反汇编生成的二进制文件来验证这一点。如果没有发出“mfence”指令(取决于目标平台),那么很明显 CPU 没有被告知发出内存围栏。
根据您所在的平台以及您想要做的事情,可能会有一些“更好”或更清晰的东西......但不考虑可移植性。
关于gcc - mfence 和 asm volatile 的区别 ("": : : "memory"),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12183311/
这将是一篇很长的文章,为了将其上下文化并提供尽可能多的信息,我必须仔细浏览各种链接和引号——这通常是我们进入 C/C++ 标准兔子洞的唯一方法。如果您对这篇文章有更好的引用或任何其他改进,请告诉我。但
我想知道 volatile 关键字与 register、const 和 static 结合的不同用途关键词。我不确定有什么影响,所以我认为: register volatile int T=10; 建
让我们考虑以下 Java 代码 int x = 0; int who = 1 Thread #1: (1) x++; (2) who = 2; Thread #2 while(who
有一个函数“remove_cv”(http://en.cppreference.com/w/cpp/types/remove_cv)可以删除常量和 volatile 。 我的问题是为什么可以从“con
我正在尝试在下面的“MpscQueue.h”中的嵌入式目标上实现多个生产者(通过中断)、单个消费者(通过应用程序线程)队列。 我想知道我是否可以安全地删除一些 volatile下面的用法(见内联问
我的问题适用于最初为 null 的字段,然后初始化为非 null 值,然后不再更改。 由于该字段需要尽快可供所有线程使用,因此我需要使用 volatile 。 但是,如果我想尽可能避免 volatil
我以前见过几次类似 fld = fld 的东西,但在所有这些情况下,可以消除虚拟写入并获得更好的性能。 public class Tst{ public volatile int fld =
看完this question和 this (尤其是第二个答案)我对 volatile 及其与内存屏障有关的语义感到非常困惑。 在上面的例子中,我们写入了一个 volatile 变量,这会导致一个 m
如下所示,该程序有一个共享 var flag,但不带 volatile : public class T { public static void main(String[] args) {
我明白声明 int *volatile ptr; 表示指针本身是volatile int a=10; int *volatile ptr=&a; 现在 ptr 和 a 都在更新。会不会导致访问ptr时
最近我需要比较两个 uint 数组(一个是 volatile 数组,另一个是非 volatile 数组),结果令人困惑,我一定是对 volatile 数组有一些误解。 我需要从输入设备读取一个数组并将
这两个 C 定义有什么区别? volatile uint32_t *ptr1 = (volatile uint32_t *)0x20040000; volatile uint32_t *ptr1 =
// structure is like this, but not exact formation. class queue { volatile List worksWaiting; }
考虑以下这段代码: struct S{ int i; S(int); S(const volatile S&); }; struct S_bad{ int i; }; vola
在 Windows x64 上,考虑到一些额外的见解,何时允许编译器将 ABI 标记为 volatile 的寄存器视为非 volatile 寄存器?我有一个反汇编函数,其中 r11 用于在函数调用后恢
我对下面的代码段有疑问。结果可能有 [0, 1, 0] 的结果(这是用 JCStress 执行的测试)。那么这怎么会发生呢?我认为应该在写入 Actor2 (guard2 = 1) 中的 guard2
好吧,假设我有一堆变量,其中一个声明为 volatile: int a; int b; int c; volatile int v; 如果一个线程写入所有四个变量(最后写入 v),而另一个线程读取所有
我试图理解为什么这个例子是一个正确同步的程序: a - volatile Thread1: x=a Thread2: a=5 因为存在冲突访问(存在对 a 的写入和读取),所以在每个顺序一致性执行中,
我正在编写一个需要同时支持 volatile 和非 volatile 实例的类( volatile 实例使用原子操作,非 volatile 实例使用常规操作),并且想知道我是否以正确的方式进行处理。到
我正在为 Cortex-M0 CPU 和 gcc 编写代码。我有以下结构: struct { volatile unsigned flag1: 1; unsigned flag2: 1
我是一名优秀的程序员,十分优秀!