- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
由于std::atomic::is_lock_free()
可能无法真正反射(reflect)现实情况[ref],因此我正在考虑编写真正的运行时测试。但是,当我着手解决这个问题时,我发现这并不是我认为的微不足道的任务。我想知道是否有一些聪明的主意可以做到这一点。
最佳答案
除了性能以外,该标准并不能保证您可以说出任何方法。这或多或少是关键。
如果愿意引入某些特定于平台的UB,则可以执行类似将atomic<int64_t> *
转换为volatile int64_t*
的操作,并查看是否在其他线程读取对象时观察到“撕裂”。 (When to use volatile with multi threading?-通常从不,但是真正的硬件在运行线程的内核之间具有一致的缓存,因此普通的asm加载/存储基本上就像是原子的放松。)
如果此测试成功(即普通的C++类型自然是原子的,仅带有volatile
),这将告诉您任何理智的编译器都将使其廉价地实现无锁。但是,如果失败了,它不会告诉您太多。该类型的无锁原子可能仅比用于加载/存储的普通版本稍微贵一点,或者编译器可能根本没有使其成为无锁。例如在32位x86上,无锁int64_t
仅使用少量开销即可有效(使用SSE2或x87),但是volatile int64_t*
将使用两个单独的4字节整数加载产生撕裂,或存储大多数编译器对其进行编译的方式。
在任何特定平台/目标体系结构上,您都可以在调试器中单步执行代码,并查看运行的asm指令。 (包括进入像__atomic_store_16
这样的libatomic函数调用)。这是唯一100%可靠的方法。 (另请参阅ISA文档,以检查不同指令的原子性保证,例如,在什么条件下是否保证ARM加载/存储对。)
(有趣的事实:gcc7 with statically linked libatomic可能始终对x86-64上的16个字节的对象使用锁定,因为它没有机会在动态链接时进行运行时CPU检测,而没有机会使用支持glibc的相同机制在支持它的CPU上使用lock cmpxchg16b
用于为当前系统选择最佳的memcpy/strchr实现。)
您可以轻而易举地寻求性能差异(例如,具有多个读取器的可伸缩性),但是x86-64 lock cmpxchg16b
无法缩放1。 与8个字节或更窄的原子对象where pure asm loads are atomic and can be used不同,多个阅读器相互竞争。 lock cmpxchg16b
在执行之前获得对缓存行的排他访问;在无法实现.load()
的情况下滥用原子加载旧值的副作用要比仅编译为常规加载指令的8字节原子加载严重得多。
这是gcc7决定停止在in the GCC mailing list message about the change you're asking about中描述的16字节对象上对is_lock_free()
返回true的部分原因。
还要注意,在32位x86上的clang使用lock cmpxchg8b
来实现std::atomic<int64_t>
,就像在64位模式下对16字节对象一样。因此,您也会发现它缺乏并行读取缩放。 (https://bugs.llvm.org/show_bug.cgi?id=33109)
使用锁定的std::atomic<>
实现通常仍不会通过在每个对象中包含lock
字节或单词来使对象变大。它将改变ABI,但是无锁与锁定已经是ABI的区别。我认为该标准允许这样做,但是即使在无锁的情况下,怪异的硬件也可能在对象中需要额外的字节。无论如何,sizeof(atomic<T>) == sizeof(T)
都不会告诉您任何信息。如果更大,则很可能是您的实现中添加了互斥锁,但是如果不检查asm,就无法确定。 (如果大小不是2的幂,则可能会扩大它以进行对齐。)
(在C11中,在对象中包括锁的范围要小得多:即使在最小的初始化(例如,静态地为0)且没有析构函数的情况下,它也必须起作用,并且没有析构函数。编译器/ABI通常希望其C stdatomic.h
原子与它们的C++兼容。 std::atomic
原子。)
正常的机制是将原子对象的地址用作锁全局哈希表的键。别名/冲突和共享同一锁的两个对象是额外的争用,但不是正确性问题。这些锁仅从库函数中获取/释放,而不是在持有其他此类锁的同时释放,因此它无法创建死锁。
您可以通过使用两个不同进程之间的共享内存来检测到此情况(因此每个进程将具有自己的锁哈希表)。
Is C++11 atomic<T> usable with mmap?
std::atomic<T>
与T
的大小是否相同(因此该锁不在对象本身中)。volatile
建议的内容相同。fetch_add
/operator++
之类的读-修改-写操作也需要特殊支持:Can num++ be atomic for 'int num'?sizeof()
来排除这种情况的原因。
To facilitate inter-process communication via shared memory, it is our intent that lock-free operations also be address-free. That is, atomic operations on the same memory location via two different addresses will communicate atomically. The implementation shall not depend on any per-process state.
movaps
加载/存储,但是在Intel/AMD手册中并不能保证在奔腾及以后的8字节x87/MMX/SSE加载/存储中会采用这种方式。由于无法检测到哪些CPU/没有原子的128位操作(除了
lock cmpxchg16b
),因此编译器编写者无法安全地使用它们。
lock cmpxchg16b
在这样的系统上更昂贵,则为IDK。)
union
hack才能使其仅对对象的前半部分执行8字节的原子加载。
How can I implement ABA counter with c++11 CAS?。对于ABA计数器,通常无论如何都要用CAS更新它,因此缺少16字节的原子纯存储不是问题。
关于c++ - 真正测试std::atomic是否无锁,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49848793/
一、公平锁和非公平锁 1.1、公平锁和非公平锁的概述 公平锁:指多个线程按照申请锁的顺序来获取锁。 非公平锁:指在多线程获取锁的顺序并不是按照申请锁的顺序,有可能后申请的线程比先申请的线程优先获取到锁
阅读目录 1、简介 2、分类 3、全局锁 4、表级锁 5、表锁 6、元数据锁
因此,在我编写的程序中,我有三个函数,为了简单起见,我们将它们称为 A、B 和 C。每个函数都需要访问资源X才能工作。 限制是A和B不允许同时运行并且必须适当同步。但是,C 可以与 A 或 B 同时运
我听说过这些与并发编程相关的词,但是锁、互斥量和信号量之间有什么区别? 最佳答案 锁只允许一个线程进入被锁定的部分,并且该锁不与任何其他进程共享。 互斥锁与锁相同,但它可以是系统范围的(由多个进程共享
这个问题已经有答案了: What is an efficient way to implement a singleton pattern in Java? [closed] (29 个回答) 已关闭
这个问题已经有答案了: What is an efficient way to implement a singleton pattern in Java? [closed] (29 个回答) 已关闭
我对标题中的主题有几个问题。首先,假设我们使用 JDBC,并且有 2 个事务 T1 和 T2。在 T1 中,我们在一个特定的行上执行 select 语句。然后我们对该行执行更新。在事务 T2 中,我们
我希望我的函数只运行一次。这意味着如果多个线程同时调用它,该函数将阻塞所有线程,只允许它运行。 最佳答案 听起来您希望存储过程进行同步。为什么不直接将同步放在应用程序本身中。 pthread_mute
if (runInDemoMode) { lock (this) { //Initalization of tables dCreator.create
我相信无论使用什么语言都可以考虑我的问题,但是为了有一些“ anchor ”,我将使用 Java 语言来描述它。 让我们考虑以下场景:我有一个扩展 Thread 的类 PickyHost 及其实例 p
我知道异步不是并行的,但我现在遇到了一个非常有趣的情况。 async function magic(){ /* some processing here */ await async () =
我们正在使用 Scala、Play 框架和 MongoDB(以 ReactiveMongo 作为我们的驱动程序)构建一个网络应用程序。应用程序架构是端到端的非阻塞。 在我们代码的某些部分,我们需要访问
我需要一个简单的锁,JavaME 超时(concurrent.lock 的反向移植需要完整的 Java 1.3)。 如果其他人已经为 JavaME 发布了经过测试的锁定代码,我宁愿使用它。 锁定是出了
根据 boost : To access the object, a weak_ptr can be converted to a shared_ptr using the shared_ptr co
关于 Mutex 和 Critical 部分之间的区别存在一个问题,但它也不处理 Locks。 所以我想知道临界区是否可以用于进程之间的线程同步。 还有信号状态和非信号状态的含义 最佳答案 在 Win
锁 最为常见的应用就是 高并发的情况下,库存的控制。本次只做简单的单机锁介绍。 直接看代码: 每请求一次库存-1. 假如库存1000,在1000个人请求之后,库存将变为0。
线程和进程 1、线程共享创建它的进程的地址空间,进程有自己的地址空间 2、线程可以访问进程所有的数据,线程可以相互访问 3、线程之间的数据是独立的 4、子进程复制线程的数据 5、子进程启动
**摘要:**细心的你也一定关注到,有的网址是https开头的,有的是http。https开头的网站前面,会有一把小锁。这是为什么呢? 本文分享自华为云社区《还不知道SSL证书已经是刚需了?赶快来了解
试图在 C 中实现一个非常简单的互斥锁(锁)我有点困惑。我知道互斥锁类似于二进制信号量,除了互斥锁还强制执行释放锁的线程的约束,必须是最近获得它的同一线程。我对如何跟踪所有权感到困惑? 这是我到目前为
在阅读了很多与上述主题相关的文章和答案之后,我仍然想知道 SQL Server 数据库引擎在以下示例中是如何工作的: 假设我们有一个名为 t3 的表: create table t3 (a int ,
我是一名优秀的程序员,十分优秀!