c++ - (C/C++) 为什么使用全局变量同步单个读取器和单个写入器是有效的？-6ren

c++ - (C/C++) 为什么使用全局变量同步单个读取器和单个写入器是有效的？

转载作者：行者123 更新时间：2023-12-03 03:26:18

26

4

假设有一个像 std::vector 这样的数据结构和一个初始化为零的全局变量 intsyncToken。另外，恰好有两个线程作为读取器/写入器，为什么以下(伪)代码(in)有效？

void reader_thread(){
    while(1){
        if(syncToken!=0){
            while(the_vector.length()>0){
                 // ... process the std::vector 
            }
            syncToken = 0;  // let the writer do it's work
        }
        sleep(1);
    }
}

void writer_thread(){
    while(1){
        std::string data = waitAndReadDataFromSomeResource(the_resource);
        if(syncToken==0){
            the_vector.push(data);
            syncToken = 1;  // would syncToken++; be a difference here?
        }
        // drop data in case we couldn't write to the vector
    }
}

虽然这段代码的(时间)效率不高，但据我所知，该代码是有效的，因为两个线程仅以不会导致未定义行为的方式同步全局变量值。唯一的问题可能发生在同时使用 vector 时，但这不应该发生，因为仅在零和一之间切换作为同步值，对吗？

更新由于我犯了只问是/否问题的错误，因此我将问题更新为“为什么”，希望得到一个非常具体的案例作为答案。似乎问题本身根据答案绘制了错误的图片，因此我将详细说明上面代码中我的问题/疑问。

首先，我想指出，我要求提供一个特定的用例/示例/证明/详细解释，以准确说明不同步的情况。即使是让示例计数器表现出非单调递增的 C 示例代码也只会回答是/否问题，而不是为什么!我感兴趣的是为什么。因此，如果您提供一个示例来证明它存在问题，我会对原因感兴趣。

根据(我的)定义，当且仅当 if 语句中的代码(不包括 if block 底部的syncToken 赋值)只能由这两个给定线程之一执行时，上述代码才应命名为同步。给定时间。

基于这个想法，我正在寻找一个可能基于汇编程序的示例，其中两个线程同时执行 if block - 意味着它们不同步或不同步。

作为引用，我们看一下 gcc 生成的汇编代码的相关部分:

; just the declaration of an integer global variable on a 64bit cpu initialized to zero
syncToken:
.zero   4
.text
.globl  main
.type   main, @function

; writer (Cpu/Thread B): if syncToken == 0, jump not equal to label .L1
movl    syncToken(%rip), %eax
testl   %eax, %eax
jne .L1

; reader (Cpu/Thread A): if syncToken != 0, jump to Label L2
movl    syncToken(%rip), %eax
testl   %eax, %eax
je  .L2

; set syncToken to be zero
movl    $0, syncToken(%rip)

现在我的问题是，我不明白为什么这些指令会不同步。

假设两个线程都在自己的 CPU 核心上运行，例如线程 A 在核心 A 上运行，线程 B 在核心 B 上运行。初始化是全局的，并且在两个线程开始执行之前完成，因此我们可以忽略初始化并假设两个线程都启动与syncToken=0；

示例:

CPU A:movlsyncToken(%rip)，%eax
CPU A:上下文切换(保存所有寄存器)
CPU B:movlsyncToken(%rip)，%eax
CPU B:teSTL %eax，%eax
CPU B: jne .L1 ;这个是 false => 如果阻塞则执行 writer
CPU B:上下文切换
CPU A:上下文切换到线程(恢复所有寄存器)
CPU A:teSTL %eax，%eax
CPU A: je .L2 ;这是 false => 不执行 if block

老实说，我构建了一个运行良好的示例，但它表明我看不出为什么变量应该不同步，以便两个线程同时执行 if block 。我的观点是:虽然上下文切换会导致 %eax 与 RAM 中的syncToken的实际值不一致，但代码应该做正确的事情，如果它不是唯一允许运行的线程，则不执行 if block 它。

更新2可以假设syncToken只会像所示的代码中那样使用。不允许其他函数(如 waitAndReadDataFromSomeResource)以任何方式使用它

更新3让我们更进一步，提出一个稍微不同的问题:是否可以使用 intsyncToken 同步两个线程、一个读取器、一个写入器，以便线程不会通过同时执行 if block 而始终不同步？如果是的话 - 那很有趣^^如果不是 - 为什么？

最佳答案

基本问题是您假设对 syncToken 的更新与对 vector 的更新是原子的，但事实并非如此。

无法保证在多核 CPU 上这两个线程不会在不同的核心上运行。并且无法保证内存更新写入主内存或缓存从主内存刷新的顺序。

因此，当在读取线程中将 syncToken 设置为零时，写入线程可能会在看到 vector 内存的更改之前看到该更改。因此它可以开始将内容推送到 vector 的过时末尾。

类似地，当您在编写器线程中设置 token 时，读取器可能会开始访问 vector 内容的旧版本。更有趣的是，根据 vector 的实现方式，读者可能会看到 vector header 包含指向内存内容的旧指针

void reader_thread(){
    while(1){
        if(syncToken!=0){
            while(the_vector.length()>0){
                 // ... process the std::vector 
            }
            syncToken = 0;  // let the writer do it's work
        }
        sleep(1);

此 sleep 将在进入操作系统时导致内存刷新，但无法保证内存刷新的顺序或编写器线程将按照哪个顺序看到它。

    }
}

void writer_thread(){
    while(1){
        std::string data = waitAndReadDataFromSomeResource(the_resource);

这可能导致内存刷新。另一方面也可能不会。

        if(syncToken==0){
            the_vector.push(data);
            syncToken = 1;  // would syncToken++; be a difference here?
        }
        // drop data in case we couldn't write to the vector
    }
}

使用 syncToken++ (一般来说)没有帮助，因为它执行读/修改/写操作，因此如果另一端碰巧同时进行修改，您可能会得到任何某种结果。

为了安全起见，您需要使用内存同步或锁来确保内存以正确的顺序读取/写入。

在此代码中，您需要在读取 syncToken 之前使用读同步屏障，并在写入之前使用写同步屏障。

使用写同步可确保在之后的任何更新之前，到该点的所有内存更新对主内存都是可见的 - 以便在 syncToken 之前正确更新 the_vector设置为一。

在读取syncToken之前使用读取同步将确保缓存中的内容与主内存是正确的。

一般来说，这可能相当棘手，除非性能非常关键，否则最好使用互斥体或信号量来确保同步。

正如 Anders 所指出的，编译器仍然可以自由地重新排序对 syncToken 的访问和对 the_vector 的访问(如果它可以确定这些函数的作用，则可以使用std::vector 它可能可以) - 添加内存屏障将停止这种重新排序。将 syncToken 设为 volatile 也会停止重新排序，但它不会解决多核系统上的内存一致性问题，并且不允许您安全地对同一系统进行读取/修改/写入来自 2 个线程的变量。

关于c++ - (C/C++) 为什么使用全局变量同步单个读取器和单个写入器是有效的？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33997776/

26

4

0

文章推荐： .net - 除了 Microsoft 和 Mono 之外，还有其他 .Net 实现吗？

文章推荐： c - x86内核中的键盘IRQ

文章推荐： vim - "execute normal"之后从插入模式返回正常模式

javascript - 使用 WebScriptEndpoint 使用 javascript 使用 WCF 服务
我在网上搜索但没有找到任何合适的文章解释如何使用 javascript 使用 WCF 服务，尤其是 WebScriptEndpoint。任何人都可以对此给出任何指导吗？谢谢最佳答案这是一篇关于
c - 没有结果!!使用 fork() 使用 dup2 使用 2 个管道运行 execlp()
我正在编写一个将运行 Linux 命令的 C 程序，例如: cat/etc/passwd | grep 列表 |剪切-c 1-5 我没有任何结果 *这里 parent 等待第一个 child (chi
python - 处理文件上传，使用 Pillow 调整大小，使用 SQLAlchemy 存储，使用 Flask 提供文件
所以我正在尝试处理文件上传，然后将该文件作为二进制文件存储到数据库中。在我存储它之后，我尝试在给定的 URL 上提供文件。我似乎找不到适合这里的方法。我需要使用数据库，因为我使用 Google 应用引
excel - 使用 IF 使用 VBA 在单元格中添加公式的问题
我正在尝试制作一个宏，将下面的公式添加到单元格中，然后将其拖到整个列中并在 H 列中复制相同的公式我想在 F 和 H 列中输入公式的数据 Range("F1").formula = "=IF(ISE
使用 OperatorPrecedenceParser 使用 FParsec 解析函数应用程序？
问题类似于this one ，但我想使用 OperatorPrecedenceParser 解析带有函数应用程序的表达式在 FParsec . 这是我的 AST: type Expression =
sql - 使用 sequelize 使用 where 查询编码计数
我想通过使用 sequelize 和 node.js 将这个查询更改为代码取决于在哪里 select COUNT(gender) as genderCount from customers where
bash - 使用 “let”分配Bash失败，使用 “/”
我正在使用GNU bash，版本5.0.3(1)-发行版(x86_64-pc-linux-gnu)，我想知道为什么简单的赋值语句会出现语法错误: #/bin/bash var1=/tmp
javascript - 使用 JavaScript 使用 FOR OF 数组循环时出现错误？
这里，为什么我的代码在 IE 中不起作用。我的代码适用于所有浏览器。没有问题。但是当我在 IE 上运行我的项目时，它发现错误。而且我的 jquery 类和 insertadjacentHTMl 也不
javascript - 使用 javascript 使用 for 属性更改表单标签内容
我正在尝试更改标签的innerHTML。我无权访问该表单，因此无法编辑 HTML。标签具有的唯一标识符是“for”属性。这是输入和标签的结构:
javascript - 使用 jquery 使用 .on() 将事件附加到页面上的动态插入按钮
我有一个页面，我可以在其中返回用户帖子，可以使用一些 jquery 代码对这些帖子进行即时评论，在发布新评论后，我在帖子下插入新评论以及删除按钮。问题是 Delete 按钮在新插入的元素上不起作用，
使用 awk 使用 sha1sum 进行散列
我有一个大约有 20 列的“管道分隔”文件。我只想使用 sha1sum 散列第一列，它是一个数字，如帐号，并按原样返回其余列。使用 awk 或 sed 执行此操作的最佳方法是什么？ Accounti
mysql - 使用 insert into 使用 mysql
我需要将以下内容插入到我的表中...我的用户表有五列 id、用户名、密码、名称、条目。 (我还没有提交任何东西到条目中，我稍后会使用 php 来做)但由于某种原因我不断收到这个错误:#1054 - U
jquery - 将输入字段值修剪为仅字母数字字符/使用 .使用 jQuery
所以我试图有一个输入字段，我可以在其中输入任何字符，但然后将输入的值小写，删除任何非字母数字字符，留下“。”而不是空格。例如，如果我输入: 地球的 70% 是水，-!*#$^^ & 30% 土地输
javascript - 使用 .innerHTML 使用 DOM
我正在尝试做一些我认为非常简单的事情，但出于某种原因我没有得到想要的结果？我是 javascript 的新手，但对 java 有经验，所以我相信我没有使用某种正确的规则。这是一个获取输入值、检查选择
php - 使用 angularjs 使用 where 子句从数据库获取数据
我想使用 angularjs 从 mysql 数据库加载数据。这就是应用程序的工作原理；用户登录，他们的用户名存储在 cookie 中。该用户名显示在主页上我想获取这个值并通过 angularjs
ios - 使用 UITableViewCell 使用 AutoLayout
我正在使用 autoLayout，我想在 UITableViewCell 上放置一个 UIlabel，它应该始终位于单元格的右侧和右侧的中心。这就是我想要实现的目标所以在这里你可以看到我正在谈论的
mysql - 使用 ElasticSearch 使用 or 和运算符搜索多个字段
我需要与 MySql 等效的 elasticsearch 查询。我的 sql 查询: SELECT DISTINCT t.product_id AS id FROM tbl_sup_price t
ios - 使用 Swift 使用 JSON
我正在实现代码以使用 JSON。 func setup() { if let flickrURL = NSURL(string: "https://api.flickr.com/
javascript - 使用 JavaScript 使用 for 循环声明变量
我尝试使用for循环声明变量，然后测试cols和rols是否相同。如果是，它将运行递归函数。但是，我在 javascript 中执行 do 时遇到问题。有人可以帮忙吗？现在，在比较 col.1 和
jquery - 使用 :after 使用 jquery 更改样式
我举了一个我正在处理的问题的简短示例。 HTML代码: 1 2 3 CSS 代码: .BB a:hover{ color: #000; } .BB > li:after {

首页

博学

6Ren·AI

商城

c++ - (C/C++) 为什么使用全局变量同步单个读取器和单个写入器是有效的？