java - volatile 贵吗？-6ren

java - volatile 贵吗？

转载作者：IT老高更新时间：2023-10-28 11:23:52

26

4

看完The JSR-133 Cookbook for Compiler Writers关于 volatile 的实现，尤其是“与原子指令的交互”部分，我假设读取 volatile 变量而不更新它需要 LoadLoad 或 LoadStore 屏障。在页面的下方，我看到 LoadLoad 和 LoadStore 在 X86 CPU 上实际上是无操作的。这是否意味着 volatile 读取操作可以在 x86 上没有显式缓存失效的情况下完成，并且与普通变量读取一样快(忽略 volatile 的重新排序约束)？

我相信我没有正确理解这一点。有人可以开导我吗？

编辑:我想知道多处理器环境是否存在差异。正如 John V. 所说，在单 CPU 系统上，CPU 可能会查看它自己的线程缓存，但在多 CPU 系统上，CPU 必须有一些配置选项，这还不够，并且必须命中主内存，从而使 volatile 变慢在多 CPU 系统上，对吧？

PS:在了解更多信息的过程中，我偶然发现了以下精彩文章，由于其他人可能会对这个问题感兴趣，因此我将在此处分享我的链接:

最佳答案

在 Intel 上，非竞争性 volatile 读取非常便宜。如果我们考虑以下简单的情况:

public static long l;

public static void run() {        
    if (l == -1)
        System.exit(-1);

    if (l == -2)
        System.exit(-1);
}

使用 Java 7 打印汇编代码的能力，run 方法看起来像:

# {method} 'run2' '()V' in 'Test2'
#           [sp+0x10]  (sp of caller)
0xb396ce80: mov    %eax,-0x3000(%esp)
0xb396ce87: push   %ebp
0xb396ce88: sub    $0x8,%esp          ;*synchronization entry
                                    ; - Test2::run2@-1 (line 33)
0xb396ce8e: mov    $0xffffffff,%ecx
0xb396ce93: mov    $0xffffffff,%ebx
0xb396ce98: mov    $0x6fa2b2f0,%esi   ;   {oop('Test2')}
0xb396ce9d: mov    0x150(%esi),%ebp
0xb396cea3: mov    0x154(%esi),%edi   ;*getstatic l
                                    ; - Test2::run@0 (line 33)
0xb396cea9: cmp    %ecx,%ebp
0xb396ceab: jne    0xb396ceaf
0xb396cead: cmp    %ebx,%edi
0xb396ceaf: je     0xb396cece         ;*getstatic l
                                    ; - Test2::run@14 (line 37)
0xb396ceb1: mov    $0xfffffffe,%ecx
0xb396ceb6: mov    $0xffffffff,%ebx
0xb396cebb: cmp    %ecx,%ebp
0xb396cebd: jne    0xb396cec1
0xb396cebf: cmp    %ebx,%edi
0xb396cec1: je     0xb396ceeb         ;*return
                                    ; - Test2::run@28 (line 40)
0xb396cec3: add    $0x8,%esp
0xb396cec6: pop    %ebp
0xb396cec7: test   %eax,0xb7732000    ;   {poll_return}
;... lines removed

如果您查看对 getstatic 的 2 个引用，第一个涉及从内存加载，第二个跳过加载，因为该值从已加载到的寄存器中重用(long 是 64 位，在我的32 位笔记本电脑，它使用 2 个寄存器)。

如果我们将 l 变量设为 volatile，则生成的程序集会有所不同。

# {method} 'run2' '()V' in 'Test2'
#           [sp+0x10]  (sp of caller)
0xb3ab9340: mov    %eax,-0x3000(%esp)
0xb3ab9347: push   %ebp
0xb3ab9348: sub    $0x8,%esp          ;*synchronization entry
                                    ; - Test2::run2@-1 (line 32)
0xb3ab934e: mov    $0xffffffff,%ecx
0xb3ab9353: mov    $0xffffffff,%ebx
0xb3ab9358: mov    $0x150,%ebp
0xb3ab935d: movsd  0x6fb7b2f0(%ebp),%xmm0  ;   {oop('Test2')}
0xb3ab9365: movd   %xmm0,%eax
0xb3ab9369: psrlq  $0x20,%xmm0
0xb3ab936e: movd   %xmm0,%edx         ;*getstatic l
                                    ; - Test2::run@0 (line 32)
0xb3ab9372: cmp    %ecx,%eax
0xb3ab9374: jne    0xb3ab9378
0xb3ab9376: cmp    %ebx,%edx
0xb3ab9378: je     0xb3ab93ac
0xb3ab937a: mov    $0xfffffffe,%ecx
0xb3ab937f: mov    $0xffffffff,%ebx
0xb3ab9384: movsd  0x6fb7b2f0(%ebp),%xmm0  ;   {oop('Test2')}
0xb3ab938c: movd   %xmm0,%ebp
0xb3ab9390: psrlq  $0x20,%xmm0
0xb3ab9395: movd   %xmm0,%edi         ;*getstatic l
                                    ; - Test2::run@14 (line 36)
0xb3ab9399: cmp    %ecx,%ebp
0xb3ab939b: jne    0xb3ab939f
0xb3ab939d: cmp    %ebx,%edi
0xb3ab939f: je     0xb3ab93ba         ;*return
;... lines removed

在这种情况下，对变量 l 的两个 getstatic 引用都涉及从内存中加载，即该值不能跨多个 volatile 读取保存在寄存器中。为了确保进行原子读取，将值从主存储器读取到 MMX 寄存器 movsd 0x6fb7b2f0(%ebp),%xmm0 使读取操作成为一条指令(从前面的示例中我们看到64 位值通常需要在 32 位系统上进行两次 32 位读取)。

因此， volatile 读取的总成本大致相当于内存负载，并且可以与 L1 缓存访问一样便宜。但是，如果另一个内核正在写入 volatile 变量，则缓存行将失效，需要主存储器或 L3 缓存访问。实际成本将在很大程度上取决于 CPU 架构。即使在 Intel 和 AMD 之间，缓存一致性协议(protocol)也不同。

关于java - volatile 贵吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4633866/

26

4

0

文章推荐： iphone - 编译错误与 : switch, "expected expression before"

文章推荐： ios - 使用应用组在应用之间通信和保存数据

文章推荐： build - 更改 TFS 2010 中构建通知的轮询间隔

c++ - 通过 volatile 引用/指针访问声明的非 volatile 对象是否赋予所述访问 volatile 规则？
这将是一篇很长的文章，为了将其上下文化并提供尽可能多的信息，我必须仔细浏览各种链接和引号——这通常是我们进入 C/C++ 标准兔子洞的唯一方法。如果您对这篇文章有更好的引用或任何其他改进，请告诉我。但
c++ - 我什么时候在 C++ 中使用 const volatile、register volatile、static volatile？
我想知道 volatile 关键字与 register、const 和 static 结合的不同用途关键词。我不确定有什么影响，所以我认为: register volatile int T=10; 建
java - volatile 与非 volatile
让我们考虑以下 Java 代码 int x = 0; int who = 1 Thread #1: (1) x++; (2) who = 2; Thread #2 while(who
c++ - 如何通过 remove_cv 函数推断类型(const volatile int* vs const volatile int vs int * const volatile)
有一个函数“remove_cv”(http://en.cppreference.com/w/cpp/types/remove_cv)可以删除常量和 volatile 。我的问题是为什么可以从“con
c++ - volatile 成员变量与 volatile 对象？
我正在尝试在下面的“MpscQueue.h”中的嵌入式目标上实现多个生产者(通过中断)、单个消费者(通过应用程序线程)队列。我想知道我是否可以安全地删除一些 volatile下面的用法(见内联问
java - 混合 volatile 和非 volatile
我的问题适用于最初为 null 的字段，然后初始化为非 null 值，然后不再更改。由于该字段需要尽快可供所有线程使用，因此我需要使用 volatile 。但是，如果我想尽可能避免 volatil
java - volatile 写入 = volatile 读取
我以前见过几次类似 fld = fld 的东西，但在所有这些情况下，可以消除虚拟写入并获得更好的性能。 public class Tst{ public volatile int fld =
java - volatile 读取和非 volatile 字段
看完this question和 this (尤其是第二个答案)我对 volatile 及其与内存屏障有关的语义感到非常困惑。在上面的例子中，我们写入了一个 volatile 变量，这会导致一个 m
java - 为什么没有 'volatile' 的程序运行为 'volatile' ？
如下所示，该程序有一个共享 var flag，但不带 volatile : public class T { public static void main(String[] args) {
c - volatile 指针指向非 volatile 数据
我明白声明 int *volatile ptr; 表示指针本身是volatile int a=10; int *volatile ptr=&a; 现在 ptr 和 a 都在更新。会不会导致访问ptr时
比较 volatile 数组和非 volatile 数组
最近我需要比较两个 uint 数组(一个是 volatile 数组，另一个是非 volatile 数组)，结果令人困惑，我一定是对 volatile 数组有一些误解。我需要从输入设备读取一个数组并将
c - volatile 和不 volatile 类型转换的区别
这两个 C 定义有什么区别？ volatile uint32_t *ptr1 = (volatile uint32_t *)0x20040000; volatile uint32_t *ptr1 =
非 volatile 对象中的java volatile 对象
// structure is like this, but not exact formation. class queue { volatile List worksWaiting; }
c++ - volatile 类类型的丢弃值表达式与 volatile 内置类型的行为不同
考虑以下这段代码: struct S{ int i; S(int); S(const volatile S&); }; struct S_bad{ int i; }; vola
windows - "ABI-volatile"寄存器被视为跨函数调用的非 volatile
在 Windows x64 上，考虑到一些额外的见解，何时允许编译器将 ABI 标记为 volatile 的寄存器视为非 volatile 寄存器？我有一个反汇编函数，其中 r11 用于在函数调用后恢
Java用非 volatile 重新排序 volatile 写入
我对下面的代码段有疑问。结果可能有 [0, 1, 0] 的结果(这是用 JCStress 执行的测试)。那么这怎么会发生呢？我认为应该在写入 Actor2 (guard2 = 1) 中的 guard2
java - volatile 会影响非 volatile 变量吗？
好吧，假设我有一堆变量，其中一个声明为 volatile: int a; int b; int c; volatile int v; 如果一个线程写入所有四个变量(最后写入 v)，而另一个线程读取所有
java - volatile 读取是否发生在 volatile 写入之前？
我试图理解为什么这个例子是一个正确同步的程序: a - volatile Thread1: x=a Thread2: a=5 因为存在冲突访问(存在对 a 的写入和读取)，所以在每个顺序一致性执行中，
c++ - volatile 和非 volatile 实例的重载类
我正在编写一个需要同时支持 volatile 和非 volatile 实例的类( volatile 实例使用原子操作，非 volatile 实例使用常规操作)，并且想知道我是否以正确的方式进行处理。到
c - volatile 和非 volatile 位域
我正在为 Cortex-M0 CPU 和 gcc 编写代码。我有以下结构: struct { volatile unsigned flag1: 1; unsigned flag2: 1

首页

博学

6Ren·AI

商城

java - volatile 贵吗？