- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我知道 JVM 内存模型是为 CPU 的最低公分母设计的,因此它必须假设 JVM 可以在其上运行的 cpu 的最弱模型(例如 ARM)。
现在,考虑到 x64 具有相当强大的内存模型,假设我知道我的程序将仅在 64 位 x86 CPU 上运行,我可以忽略哪些同步实践?当我的程序通过虚拟化运行时,这也适用吗?
示例:
众所周知,JVM 的内存模型需要同步对 long 和 double 的读/写访问,但可以假设其他 32 位基元(如 int、float 等)的读/写是原子的。
但是,如果我知道我在 64 位 x86 机器上运行,我是否可以忽略在 longs/double 上使用锁,因为我知道 cpu 将自动读/写 64 位值并且只是让它们保持 volatile (就像我会整数/ float )?
最佳答案
I know that the JVM memory model is made for lowest common denominator of CPUs, so it has to assume the weakest possible model of a cpu on which the JVM can run (eg ARM).
这是不正确的。 JMM 是各种竞争力量之间妥协的结果:希望使用较弱的内存模型,以便程序可以在内存模型较弱的硬件上运行得更快;希望允许某些优化的编译器编写者的愿望;以及希望并行 Java 程序的结果是正确的和可预测的,并且如果可能(!)是 Java 程序员可以理解的。参见 Sarita Adve's CACM article内存模型问题的一般概述。
Considering that x64 has a fairly strong memory model, what synchronization practices can I ignore assuming I know my program will only run on [x64] CPUs?
没有。问题在于,内存模型不仅适用于底层硬件,还适用于执行程序的 JVM,并且在实践中主要适用于 JVM 的 JIT 编译器。编译器可能会决定应用内存模型中允许的某些优化,但如果您的程序根据底层硬件对内存行为做出无根据的假设,您的程序将会中断。
您询问了 x64 和原子 64 位写入。可能在 x64 机器上永远不会发生单词撕裂。我怀疑任何 JIT 编译器都会将 64 位值分解为 32 位写入作为优化,但你永远不知道。但是,您似乎不太可能使用此功能来避免程序中的同步或可变字段。如果没有这些,对这些变量的写入可能永远不会对其他线程可见,或者它们可能会根据其他写入任意重新排序,这可能会导致您的程序出现错误。
我的建议是首先正确应用同步以使您的程序正确。你可能会感到惊喜。同步操作已经过大量优化,在一般情况下可以非常快。如果您发现存在瓶颈,请考虑使用锁拆分等优化、使用 volatile 或转换为非阻塞算法。
更新
OP 已将问题更新为更具体一些关于使用 volatile
而不是锁和同步。
事实证明,volatile
不仅具有内存可见性语义。它还使 long
和 double
访问原子化,而对于这些类型的非 volatile
变量则不是这样。查看JLS section 17.7 .您应该能够依靠 volatile
在任何硬件上提供原子性,而不仅仅是 x64。
虽然我在这里,但有关 Java 内存模型的更多信息,请参阅 Aleksey Shipilev 的 JMM Pragmatics talk transcript . (Aleksey 也是 JMH 人。)这次演讲中有很多细节,还有一些有趣的练习来测试一个人的理解力。谈话的一个总体要点是,依赖一个人对内存模型如何工作的直觉通常是错误的,例如在高速缓存行或写缓冲区方面。 JMM 是一种关于内存操作和各种约束(同步、发生在 等)的形式主义,这些约束决定了这些操作的顺序.这可能会产生非常违反直觉的结果。试图通过考虑特定的硬件属性来超越 JMM 是不明智的。它会回来咬你的。
关于java - 假设我知道我将在 x64 cpus 上运行,我可以忽略哪些 JVM 同步实践?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24918252/
本文分享自华为云社区《大模型LLM之分布式训练》,作者: 码上开花_Lancer。 随着语言模型参数量和所需训练数据量的急速增长,单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训
本文分享自华为云社区《五大基础算法--动态规划法》,作者: 大金(内蒙的)。 一、基本概念 动态规划法,和分治法极其相似。区别就是,在求解子问题时,会保存该子问题的解,后面的子问题求解时,可以直接拿来
pip install scp pip install pexpect 测试代码: import os import stat import paramiko # 用于调用scp命令 def s
我目前正在实现“ token ”REST 服务。 token 只是一个字符串,由一些参数构建而成,然后经过哈希处理并在一定时间后过期。 我想在我的 REST 服务中有一个可以验证 token 的端点,
打开软删除后,我在客户端上添加一条记录,推送,删除添加的记录推送,然后尝试使用与初始记录相同的主键添加新记录(然后推送),我得到一个异常(exception)。 EntityDomainManager
打开软删除后,我在客户端上添加一条记录,推送,删除添加的记录推送,然后尝试使用与初始记录相同的主键添加新记录(然后推送),我得到一个异常(exception)。 EntityDomainManager
我有一个应用程序,每 x 秒接收一次天气信息。我想将此数据保存到 XML 文件中。 我应该为每个天气通知创建一个新的 XML 文件,还是将每个通知附加到同一个 XML 文件中?我不确定 XML 标准的
我猜我们大多数人都必须在某个时候处理这个问题,所以我想我会问这个问题。 当您的 BLL 中有很多集合并且您发现自己一遍又一遍地编写相同的旧内联(匿名)谓词时,显然有必要进行封装,但实现封装的最佳方
我有一些 c# 代码已经运行了一段时间了..我不得不说,虽然我了解 OO 原则的基础知识,但显然有不止一种方法可以给猫剥皮(尽管我讨厌那个短语!)。 因此,我有一个基本抽象类作为基本数据服务类,如下所
我设计了一个 SQL 数据库系统(使用 Postgre),我有一个问题,即创建一个关系/引用的常见做法是什么,这种关系/引用即使在引用的对象被删除时也能持续存在。 比如有一个UserORM,还有Act
我们的目标是搜索用户输入的字符串并计算在其中找到多少元音。不幸的是我被困在这里,有什么帮助吗? def numVowels(s): vowels= "AEIOUaeiou" if s
我有一个适用于我的“items”int 数组的旋转函数。下面的代码完成了它,除了我不必要地传输值。我正在努力实现“就地”轮换。我的意思是 ptrs 会递增或递减,而不是从数组中获取值。我需要通过这种方
我有一个 json 存储在我的应用程序文档文件夹中,我需要在我的所有 View 中使用它。我正在加载 json 并将其添加到每个 View 中的 NSMutableArray。但现在我了解到,我可以将
我用 C++ 开始了一个项目。这种语言的内存管理对我来说是新的。 我过去常常使用 new () 创建对象,然后传递指针,虽然它可以工作,但调试起来很痛苦,人们看到代码时会用有趣的眼神看着我。我为它没有
已结束。 这个问题是 off-topic .它目前不接受答案。 想要改进这个问题? Update the question所以它是on-topic堆栈溢出。 关闭 10 年前。 Improve thi
保持类松散耦合是编写易于理解、修改和调试的代码的一个重要方面——我明白这一点。然而,作为一个新手,几乎任何时候我都会超越我所苦苦挣扎的最简单的例子。 我或多或少地了解如何将字符串、整数和简单数据类型封
我发现我需要编写大量重复代码,因为我无法从其他 Controller 调用函数。例如,这里新闻提要内容在我的代码中重复,我对一个 Controller 做一些特定的事情,然后需要像这样加载我的新闻提要
假设需要一种数字数据类型,其允许值在指定范围内。更具体地说,假设要定义一个整数类型,其最小值为0,最大值为5000。这种情况在很多情况下都会出现,例如在对数据库数据类型,XSD数据类型进行建模时。 在
假设我想循环整个数组来访问每个元素。使用 for 循环、for...in 循环或 for...of 循环是 JavaScript 开发人员的标准做法吗? 例如: var myArray = ["app
我有一个旧的 SL4/ria 应用程序,我希望用 Breeze 取代它。我有一个关于内存使用和缓存的问题。我的应用程序加载工作列表(一个典型的用户可以访问大约 1,000 个这些工作)。此外,还有很多
我是一名优秀的程序员,十分优秀!