- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
假设我有几个工作线程,如下所示:
while (1) {
do_something();
if (flag_isset())
do_something_else();
}
我们有几个辅助函数来检查和设置标志:
void flag_set() { global_flag = 1; }
void flag_clear() { global_flag = 0; }
int flag_isset() { return global_flag; }
因此,线程在忙循环中不断调用 do_something()
,如果其他线程设置了 global_flag
,该线程也会调用 do_something_else()
(例如,当通过设置来自另一个线程的标志请求时,它可以输出进度或调试信息)。
我的问题是:我是否需要做一些特殊的事情来同步对 global_flag 的访问?如果是,以可移植方式进行同步的最少工作量到底是多少?
我试图通过阅读许多文章来解决这个问题,但我仍然不太确定正确答案......我认为它是以下之一:
我们只需要将标志定义为 volatile
以确保每次检查时它确实是从共享内存中读取的:
volatile int global_flag;
它可能不会立即传播到其他 CPU 内核,但迟早会传播,保证。
在一个 CPU 内核中设置共享标志并不一定会让另一个内核看到它。我们需要使用互斥体来确保标志更改始终通过使其他 CPU 上的相应缓存行无效来传播。代码变成如下:
volatile int global_flag;
pthread_mutex_t flag_mutex;
void flag_set() { pthread_mutex_lock(flag_mutex); global_flag = 1; pthread_mutex_unlock(flag_mutex); }
void flag_clear() { pthread_mutex_lock(flag_mutex); global_flag = 0; pthread_mutex_unlock(flag_mutex); }
int flag_isset()
{
int rc;
pthread_mutex_lock(flag_mutex);
rc = global_flag;
pthread_mutex_unlock(flag_mutex);
return rc;
}
这与 B 相同,但我们没有在双方(读取器和写入器)上使用互斥锁,而是仅在写入端设置它。因为逻辑不需要同步。我们只需要在标志更改时同步(使其他缓存无效):
volatile int global_flag;
pthread_mutex_t flag_mutex;
void flag_set() { pthread_mutex_lock(flag_mutex); global_flag = 1; pthread_mutex_unlock(flag_mutex); }
void flag_clear() { pthread_mutex_lock(flag_mutex); global_flag = 0; pthread_mutex_unlock(flag_mutex); }
int flag_isset() { return global_flag; }
当我们知道标志很少更改时,这将避免连续锁定和解锁互斥体。我们只是使用 Pthreads 互斥体的副作用来确保传播更改。
我认为 A 和 B 是显而易见的选择,B 更安全。但是 C 呢?
如果 C 没问题,是否有其他方法可以强制标志更改在所有 CPU 上可见?
有一个有点相关的问题:Does guarding a variable with a pthread mutex guarantee it's also not cached? ...但它并没有真正回答这个问题。
最佳答案
“最小工作量”是一个明确的内存障碍。语法取决于您的编译器;在 GCC 上你可以这样做:
void flag_set() {
global_flag = 1;
__sync_synchronize(global_flag);
}
void flag_clear() {
global_flag = 0;
__sync_synchronize(global_flag);
}
int flag_isset() {
int val;
// Prevent the read from migrating backwards
__sync_synchronize(global_flag);
val = global_flag;
// and prevent it from being propagated forwards as well
__sync_synchronize(global_flag);
return val;
}
这些内存障碍实现了两个重要目标:
他们强制编译器刷新。考虑如下循环:
for (int i = 0; i < 1000000000; i++) {
flag_set(); // assume this is inlined
local_counter += i;
}
如果没有障碍,编译器可能会选择将其优化为:
for (int i = 0; i < 1000000000; i++) {
local_counter += i;
}
flag_set();
插入屏障会强制编译器立即写回变量。
它们强制 CPU 对其写入和读取进行排序。这不是单个标志的问题 - 大多数 CPU 架构最终会看到一个没有 CPU 级障碍的标志。但是顺序可能会改变。如果我们有两个标志,并且在线程 A 上:
// start with only flag A set
flag_set_B();
flag_clear_A();
在线程 B 上:
a = flag_isset_A();
b = flag_isset_B();
assert(a || b); // can be false!
一些 CPU 架构允许这些写入被重新排序;您可能会看到两个标志都是假的(即标志 A 写入首先被移动)。如果一个标志保护,比如说,一个指针是有效的,这可能是一个问题。内存屏障强制对写入进行排序以防止出现这些问题。
另请注意,在某些 CPU 上,可以使用“获取-释放”屏障语义来进一步减少开销。然而,这种区别在 x86 上不存在,并且需要在 GCC 上进行内联汇编。
可以在 the Linux kernel documentation directory 中找到关于什么是内存屏障以及为什么需要它们的很好的概述。 .最后,请注意,此代码足以用于单个标志,但如果您还想与任何其他值同步,则必须非常小心。锁通常是最简单的做事方式。
关于c - 是否需要互斥锁来同步 pthread 之间的简单标志?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7223164/
我有一个 if 语句,如下所示 if (not(fullpath.lower().endswith(".pdf")) or not (fullpath.lower().endswith(tup
然而,在 PHP 中,可以: only appears if $foo is true. only appears if $foo is false. 在 Javascript 中,能否在一个脚
XML有很多好处。它既是机器可读的,也是人类可读的,它具有标准化的格式,并且用途广泛。 它也有一些缺点。它是冗长的,不是传输大量数据的非常有效的方法。 XML最有用的方面之一是模式语言。使用模式,您可
由于长期使用 SQL2000,我并没有真正深入了解公用表表达式。 我给出的答案here (#4025380)和 here (#4018793)违背了潮流,因为他们没有使用 CTE。 我很欣赏它们对于递
我有一个应用程序: void deleteObj(id){ MyObj obj = getObjById(id); if (obj == null) { throw n
我的代码如下。可能我以类似的方式多次使用它,即简单地说,我正在以这种方式管理 session 和事务: List users= null; try{ sess
在开发J2EE Web应用程序时,我通常会按以下方式组织我的包结构 com.jameselsey.. 控制器-控制器/操作转到此处 服务-事务服务类,由控制器调用 域-应用程序使用的我的域类/对象 D
这更多是出于好奇而不是任何重要问题,但我只是想知道 memmove 中的以下片段文档: Copying takes place as if an intermediate buffer were us
路径压缩涉及将根指定为路径上每个节点的新父节点——这可能会降低根的等级,并可能降低路径上所有节点的等级。有办法解决这个问题吗?有必要处理这个吗?或者,也许可以将等级视为树高的上限而不是确切的高度? 谢
我有两个类,A 和 B。A 是 B 的父类,我有一个函数接收指向 A 类型类的指针,检查它是否也是 B 类型,如果是将调用另一个函数,该函数接受一个指向类型 B 的类的指针。当函数调用另一个函数时,我
有没有办法让 valgrind 使用多个处理器? 我正在使用 valgrind 的 callgrind 进行一些瓶颈分析,并注意到我的应用程序中的资源使用行为与在 valgrind/callgrind
假设我们要使用 ReaderT [(a,b)]超过 Maybe monad,然后我们想在列表中进行查找。 现在,一个简单且不常见的方法是: 第一种可能性 find a = ReaderT (looku
我的代码似乎有问题。我需要说的是: if ( $('html').attr('lang').val() == 'fr-FR' ) { // do this } else { // do
根据this文章(2018 年 4 月)AKS 在可用性集中运行时能够跨故障域智能放置 Pod,但尚不考虑更新域。很快就会使用更新域将 Pod 放入 AKS 中吗? 最佳答案 当您设置集群时,它已经自
course | section | type comart2 : bsit201 : lec comart2 :
我正在开发自己的 SDK,而这又依赖于某些第 3 方 SDK。例如 - OkHttp。 我应该将 OkHttp 添加到我的 build.gradle 中,还是让我的 SDK 用户包含它?在这种情况下,
随着 Rust 越来越充实,我对它的兴趣开始激起。我喜欢它支持代数数据类型,尤其是那些匹配的事实,但是对其他功能习语有什么想法吗? 例如标准库中是否有标准过滤器/映射/归约函数的集合,更重要的是,您能
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 9 年前。 Improve
我一直在研究 PHP 中的对象。我见过的所有示例甚至在它们自己的对象上都使用了对象构造函数。 PHP 会强制您这样做吗?如果是,为什么? 例如: firstname = $firstname;
...比关联数组? 关联数组会占用更多内存吗? $arr = array(1, 1, 1); $arr[10] = 1; $arr[] = 1; // <- index is 11; does the
我是一名优秀的程序员,十分优秀!