unit-testing - 一个单元在哪个级别测试无锁代码？-6ren

unit-testing - 一个单元在哪个级别测试无锁代码？

转载作者：行者123 更新时间：2023-12-04 04:37:45

26

4

可以 LLVM, QEMU, GDB, Bochs, OpenStack或类似的用于在开源平台上对无锁并发代码进行单元测试？有没有人做到这一点？

如果您通过 recommending software, 回答我不介意，但我提到 LLVM、QEMU 和其他，因为它们在不同的层次上发挥作用。我想了解在单元测试控制下交织线程的实际成功程度。

我知道 SPIN/Promela,顺便。那是很好的软件，但据我所知，不能将 C++、Rust 等编译到 SPIN/Promela 目标上。

如果您知道的话，很高兴收到现有的无锁并发代码的开源单元测试示例。 (如果我知道在哪里看，我会获取源代码并研究它。)

(另见 these questions 和他们的回答。)

示例

据我所知，我的问题不需要一个例子，所以你可以忽略这个。但是，如果可测试的无锁代码示例有助于讨论，这里有一个相对简短的 C++ 玩具示例。我没有单元测试。

#include <atomic>
#include <thread>
#include <cstdlib>
#include <iostream>

const int threshold     =  0x100;
const int large_integer = 0x1000;

// Gradually increase the integer to which q points until it reaches the
// threshold.  Then, release.
void inflate(std::atomic_bool *const p_atom, int *const q)
{
    while (*q < threshold) ++*q;
    p_atom->store(true, std::memory_order_release);
}

int main()
{
    std::atomic_bool atom{false};
    int n{0};

    // Dispatch the inflator, letting it begin gradually, in the background, to
    // inflate the integer n.
    std::thread inflator(inflate, &atom, &n);

    // Waste some time....
    for (int i = large_integer; i; --i) {}

    // Spin until the inflator has released.
    {
        int no_of_tries = 0;
        while (!atom.load(std::memory_order_acquire)) ++no_of_tries;
        std::cout << "tried " << no_of_tries << " times" << std::endl;
    }

    // Verify that the integer n has reached the threshold.
    if (n == threshold) {
        std::cout << "succeeded" << std::endl;
    }
    else {
        std::cout << "failed" << std::endl;
        std::cerr << "error"  << std::endl;
        std::exit(1);
    }

    inflator.join();
    return 0;
}

PETER CORDES 的澄清

@PeterCordes 准确地澄清了我的问题:

There can be cases where some source compiles to safe x86 asm with any reasonable compiler, but unsafe for weakly-ordered ISAs, which are also usually capable of performing an atomic RMW without a full seq-cst memory barrier (for run-time reordering; compile-time is still up to the compiler). So then you have two separate questions: Is the source portable to arbitrary C++11 systems, and is your code actually safe on x86 (if that's all you care about for now).

这两个问题对我来说都很有趣，但我想到了任意的 C++11 系统。

Usually you want to write code that's portably correct, because it usually doesn't cost any more when compiled for x86.

引用:C++17 标准草案， n4659 (6 MB PDF)，很好地解释了 Peter 提到的 C++11 并发模型。见节。 4.7.1.

DIRK HERRMANN 询价

@DirkHerrmann 问了一个相关的问题:

You ask about how to unit-test your code, but I am not sure that what you describe is truly a unit-testing scenario. Which does not mean you could not use any of the so-called unit-testing frameworks (which can in fact be used for all kinds of tests, not just unit-tests). Could you please explain what the goal of your tests would be, that is, which properties of the code you want to check?

你的观点很好。我的测试的目标是在 C++11 并发模型支持的所有可能的时序中可靠地使坏代码不及格。如果我知道代码很糟糕，那么我应该能够编写一个单元测试来不及格它。我的麻烦是这样的:

无线程。 如果代码是非线程的，我通常可以编写一个单元测试来使坏代码不及格。

线程。 为了不及格，线程代码更难，但只要互斥锁协调线程，至少代码在不同的硬件上运行类似。

无锁。 如果不及格，在特定硬件上可能无法实现无锁代码。如果我的糟糕的无锁代码在你的硬件上运行十亿分之一失败并且在我的硬件上永远不会失败怎么办？一个单元如何测试这样的代码？

我不知道我需要什么，真的。就我的 x86 CPU 不提供真正的 C++11 并发模型而言，也许我需要一个不存在的 CPU 的模拟器来提供真正的 C++11 并发模型。我不确定。

如果我确实有一个不存在的 CPU 的模拟器，它提供了真正的 C++11 并发模型，那么我的单元测试将(据我所知)需要在所有可能的合法时间下尝试我的代码。

这不是一个容易的问题。不知道有没有人解决过。

更新:CDSCHECKER 和 RELACY

讨论使我调查了各种来源，包括

CDSChecker, Norris 和 Demsky 的开源软件；和

Relacy Race Detector, Vyukov 的开源软件，之前讨论过 here.

在撰写本文时，我不知道这些是否回答了我的问题，但它们看起来很有希望。我将它们链接到这里以供引用和进一步调查。

为了引用的完整性，我还添加

SPIN/Promela,

上面已经链接了。

最佳答案

有趣的问题!

At which level does one unit test lock-free code?

令人不满意的答案是:您无法真正测试您所说的“无锁并发代码”。

无需等待，您当然可以: 使用一张纸和一支笔进行测试。尝试证明它是正确的。设计级别是测试多线程代码的正确级别。

当然，您可以为您的代码编写单元测试，您确实应该这样做，但实际上没有办法对所有可能的并发执行场景实现 100% 的覆盖。

你可以(并且应该)尝试折磨你的代码，在不同的架构上运行它(例如 x86 非常连贯，它会隐藏许多并发问题。另外在 ARM 上运行它。)。而且您仍然无法找到所有错误。

基本规则是:您不能使用测试来确保多线程代码(无锁或带锁)的任何质量级别。 100%保证正确性的唯一方法是正式证明你的代码的正确性，这通常意味着你有一个非常简单的线程设计，这很明显，每个人在5分钟内就明白了。然后你相应地编写代码。

不要误会我的意思:测试很有用。但是它让你无处可去多线程。

为什么是这样？好吧，首先单元测试方法不起作用:互斥体不能组合。

当您组合 100% 正确工作的多线程子系统 A 和 B 时，结果根本不能保证工作。互斥体不构成。条件变量不组成。线程之间的不变量不构成。只有很少且非常有限的原语，例如线程安全队列，它们组成。但是在单元测试中单独测试方面假设事物是组合的，例如函数或类。

关于unit-testing - 一个单元在哪个级别测试无锁代码？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54389994/

26

4

0

文章推荐： Azure 资源组陷入 "Moving Resources"

文章推荐： build - 用于递归 scons C++ 构建的 VariantDir

文章推荐： graph - gnuplot - 轻微的抽动没有出现

文章推荐： react-native - 如何让 FlatList 填充高度？

ruby - 如何要求正确版本的测试/单元
我试图要求 test/unit 的新版本(即不是与 ruby 捆绑的版本) .根据 instructions我用 gem i test-unit 安装它.但是现在当我需要 test/unit我似乎
Systemd 单元，使用外部脚本检查状态
简短版本是: 我有一个 systemd 单元，我想在调用时检查脚本的返回代码: systemctl status service.service 长版本:我有一个 lsb init 脚本正是这样做的，
c# - 单元/集成测试中的反射问题
我正在使用反射动态创建一个类的实例，这工作正常，除非尝试通过单元测试执行此操作 - 我使用的是 MS 测试框架。我收到熟悉的错误:“无法加载文件或程序集‘Assy’或其依赖项之一。系统找不到指定的文
javascript - (单元)测试网站界面的方法
我想知道测试网站“界面功能”的最佳实践是什么。我对哪些方法可用于测试界面和动态生成的内容感兴趣。特别是，我很难弄清楚是否可以为需要用户交互的操作创建自动化测试，或者这是否只是浪费时间，我应该让一些
python - (单元)测试python信号处理程序
我有一个简单的 Python 服务，其中有一个无限执行某些操作的循环。在各种信号上，sys.exit(0) 被调用，这导致 SystemExit 被引发，然后如果可以的话应该进行一些清理。在测试中，
c# - HoughLinesP参数!单元？
我正在使用 OpenCV 2.4.2 这是 OpenCV 文档中的引文 C++: void HoughLinesP(InputArray image, OutputArray lines, doubl
c# - 单元/集成测试和恢复数据库
忙于 C# 中的自动化测试用例，我们需要在每次测试后恢复数据库快照。问题是，当运行多个测试时它会失败，因为“其他用户正在使用数据库时无法更改数据库状态。” 我们使用 SqlConnection.Cle
C# 单元(文件范围)命名空间
我阅读了 C# 规范并用谷歌搜索了它，但一无所获。我 99% 肯定 C# 中没有像单元命名空间指令这样的功能，但问题是:为什么？是否有惯用或技术原因？这很方便，尤其是当我们的大部分文件都由单个命名
ios - iOS 单元/应用程序测试目标如何与其宿主应用程序中的类进行链接？
我目前正在尝试向我的应用程序(一个非常老的项目......评论说 iOS 2.0)添加单元测试(精确的应用程序测试)并且总是偶然发现 undefined symbols for architectur
delphi - 如何向项目添加新的(自制)单元
我正在使用Delphi 7，并且有一个新单元要在我的项目中使用。我已经编译了新的。当我尝试通过将其添加到uses子句在项目中使用此单元时，出现错误，提示未找到.dcu文件。我还尝试将文件的完整路径放在
unit-testing - 单元/集成测试nHibenrate查询
场景：我需要编写一个复杂的nHibernate查询，该查询将返回预计的DTO，但是我想使用TDD方法。该方法如下所示： public PrintDTO GetUsersForPrinting(int
slideshow - 以幻灯片模式运行 Jupyter 单元
您可以通过运行以下命令在事件 html 设置中显示 Jupyter 笔记本: $ jupyter nbconvert untitled.ipynb --to slides --post serve 有
adsense - 如何在一个页面上使用多个 AdSense 单元？
如何在一个网站上拥有多个 AdSense 单元？ Google 提供的唯一代码是按单位计算的。 (adsbygoogle = window.adsbygoogle || []).push({})
unit-testing - 单元/集成测试中文件系统依赖关系的最佳实践
我刚刚开始为大量代码编写测试。有很多类依赖于文件系统，即读取 CSV 文件、读/写配置文件等。当前测试文件存储在项目(这是一个 Maven2 项目)的 test 目录中，但由于多种原因该目录并不总是
unit-testing - (单元)测试驱动开发
我对 TDD 还很陌生，在单元测试方面也不是很老练，所以才有这个问题。我有这个用 PHP 编写的遗留函数 function foo(){ x = bar(); y = baz();
java - 垂直排列 JCheckBox 单元
我创建了一个程序，在 Swing 窗口的一侧显示结果过滤选项，但默认情况下它们水平相邻显示，这浪费了我在 BorderLayout 的西侧分配的空间。我可以在构造函数或添加语句中传递任何内容来将它们堆
c# - 如何(单元)测试弱引用列表的内存管理功能？
标题不好的借口:如果有人能更好地描述它，请做。我有一个 WeakList类，它“基本上”是一个 List> (虽然不是字面意义上的派生自列表，但它应该对用户完全透明)。现在的基本思想是“如果引用的
ios - 如何继续添加多个原型(prototype)单元
我正在尝试在 UITableView 上添加两个原型(prototype)单元。但是，我不知道如何验证是否能够为每个原型(prototype)“返回”正确的单元格。你们能帮我一下吗？ func ta
swift - 如何重新加载经过编辑的更改的 CloudKit 单元
我正在使用 CloudKit 作为数据库创建一个简单的待办事项列表应用程序。目前我可以添加和删除对象，但对编辑对象感到困惑。编辑项目 Controller protocol EditItemCont
python - 涉及序列的任务需要多少个 RNN 单元？
我正在针对以下任务训练 RNN:给定一个包含 30 个单词的序列，然后将该序列分类为二进制类。在我的网络中拥有超过 30 个单元(LSTM、GRU 或普通 RNN)有好处吗？我在网上看到过很多例子，

首页

博学

6Ren·AI

商城

unit-testing - 一个单元在哪个级别测试无锁代码？