performance - 原子 memcpy 建议-6ren

performance - 原子 memcpy 建议

转载作者：行者123 更新时间：2023-12-01 23:29:01

30

4

在测试程序的可扩展性时，我遇到了必须将 memcpy 操作设置为原子操作的情况。我必须将 64 字节的数据从一个位置复制到另一个位置。
我遇到了一种解决方案，即使用旋转变量:

struct record{
    volatile int startFlag;
    char data[64];
    volatile int doneFlag;
};

伪代码如下

struct record *node;
if ( node->startFlag ==0 ) {  // testing the flag 
    if( CompareAndSwap(node->startFlag , 0 ,1 ) ) {  // all thread tries to set, only one will get success and perform memcpy operation 
        memcpy(destination,source,NoOfBytes);
        node->doneFlag = 1; // spinning variable for other thread, those failed in CompAndSwap 
    }
    else {
         while ( node->doneFlag==0 ) { // other thread spinning 
          ; // spin around and/or use back-off policy  
         }
   }}

这可以作为原子 memcpy 执行吗？尽管如果执行 memcpy 的线程被抢占(在 memcpy 之前或之后但在设置 didFlag 之前)，则其他线程将继续旋转。或者可以做什么来使这个原子化。
情况就像其他线程必须等待，除非数据被复制，因为它们必须与插入的数据和自己的数据进行比较。
我在 startFlag 的情况下使用测试和测试和设置方法来减少一些昂贵的原子操作。自旋锁也是可扩展的，但我已经测量到原子调用比自旋锁具有更好的性能，而且我正在寻找此代码片段中可能出现的问题。由于我使用自己的内存管理器，因此内存分配和免费调用对我来说成本高昂，因此使用另一个缓冲区并复制其中的内容，然后设置指针(因为指针大小处于原子操作下)成本高昂，因为它会需要许多 mem-alloc 和 mem-free 调用。

编辑我没有使用互斥锁，因为它们似乎不可可扩展而且这只是程序的一部分，所以关键部分不是这么小(我知道对于较大的关键部分很难使用原子操作)。

最佳答案

您的代码片段肯定已损坏。 node->startFlag 上有一场竞赛

不幸的是，没有原子方法来复制 64 字节。我认为您在这里有很多选择。

以原子方式访问node->startFlag。我已经就这个主题写了几篇文章:here和 here .
使用用户模式自旋锁保护整个事物。 Here's a post on the subject
使用类似 RCU 的方法。您可以阅读有关 RCU here 的信息。简而言之，这个想法是使用指针引用要复制的缓冲区。然后你就可以:
1. 分配新缓冲区。
2. 创建其内容(从您的源中进行 memcpy)。
3. 自动用新缓冲区替换缓冲区。
4. 等待所有访问旧缓冲区的线程到期并释放它。

希望有帮助。亚历克斯。

关于performance - 原子 memcpy 建议，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6704252/

30

4

0

文章推荐： php - 如何显示与正则表达式不匹配的字符列表？

文章推荐： java - 禁止的包名: java

memcpy - memcpy 不安全吗？
这个问题在这里已经有了答案: 关闭 13 年前。重复: Memcpy() in secure programming? 根据“Please Join me in welcoming memcpy(
memcpy - memcpy 不安全吗？
这个问题在这里已经有了答案: 关闭 13 年前。重复: Memcpy() in secure programming? 根据“Please Join me in welcoming memcpy(
memcpy - strncpy/memcpy/memmove是逐字节还是以另一种有效方式复制数据？
众所周知，在x86 / x86_64之类的多字节字计算机中，逐字节地复制/移动大量内存(每步4或8个字节)要比逐字节地复制/移动更为有效。我很好奇strncpy / memcpy / memmove
c - memcpy--memcpy 后内核崩溃
我需要帮助，我正在尝试使用 memcpy 在内核空间复制 header ，但屏幕变黑，看起来它不喜欢我的 memcpy。请有人帮助我。 remaining = ntohs(iphead
c - 第二个 memcpy() 将之前的 memcpy() 数组附加到它
我在使用 memcpy() 时遇到了一点问题当我写这篇文章时 char ipA[15], ipB[15]; size_t b = 15; memcpy(ipA,line+15,b); 它从数组 li
c - 如果 memcpy 实际上不返回任何内容，如何以 memcpy 作为第一个参数调用 memset？
我正在尝试将一些 libc 代码移植到 Rust。具体来说，__tcgetattr()函数found in this file . 我只有一个部分遇到问题。 if (sizeof (cc_t) ==
c++ - 为什么调用 memcpy 到 bool 值后 memcpy 到 int 不起作用
我在玩 memcpy 时偶然发现了一个奇怪的结果，在 bool memcpy 之后对同一内存指针调用的 memcpy 给出了意想不到的结果。我创建了一个简单的测试结构，其中包含一堆不同类型的变量。我
c - Memcpy func 获取指针变量？字符*p；字符* q； memcpy(p,q,10);会起作用吗？
Memcpy 和 memcmp 函数可以接受指针变量吗？ char *p; char* q; memcpy(p,q,10); //will this work? memcmp(p,q,10); //w
c++ - 当从这个 memcpy 到子类中的新对象时，警告 "destination for this ' memcpy' call is a pointer to dynamic class ...”显示
我将创建一些具有虚拟复制功能的父类和子类，它返回自身的拷贝: class A{ public: int ID; virtual A* copy(){ retur
memcpy 可以用于类型双关吗？
这是引用自 C11 标准: 6.5 Expressions ... 6 The effective type of an object for an access to its stored valu
C memcpy 二维数组
我正在尝试使用 memcpy 将一个二维数组复制到另一个。我的代码: #include #include int print(int arr[][3], int n) { for (int
C memcpy 到结构分配
我编写了一个简单的程序来测试使用 memcpy 将字节从字节缓冲区复制到结构。但是我没有得到预期的结果。我分配了一个 100 字节的缓冲区，并将值设置为 0、1、2...99。然后我将这些字节复制到
c++ - memcpy 是否保留了琐碎对象的有效性？
如果有一个普通类型的有效对象(在这种情况下，普通类型满足普通移动/复制可构造的概念)，并且一个 memcpy 将它放到未初始化的内存区域，复制的内存区域是有效对象吗？我读到的假设:一个对象只有在它的
c++ - memcpy - 获取临时数组错误的地址
我正在研究 Arduino 并尝试更改数组的元素。在设置之前，我像这样初始化数组: bool updateArea[5] = { false }; 然后我想像这样更改数组: updateArea[0]
cuda - Memcpy 上未指定的启动失败
在 Cuda 中运行我的程序时遇到“未指定的启动失败”。我检查了错误。该程序是一个微分方程的求解器。它迭代 TOTAL_ITER 次。 ROOM_X 和 ROOM_Y 是矩阵的宽度和高度。这是标
c - memcpy 什么都不做
我试图将双缓冲放入我的 VGA dos 程序中，但是当我使用 memcpy 函数时似乎出现了问题。我确信我分配了所需的内存，但它似乎不起作用。程序如下: #include #include u
c - Memcpy() 适用于越界内存？
我一直认为 memcpy() 可以用于恶意目的。我做了几个测试应用程序，看看我是否可以从不同区域“窃取”内存中的数据。到目前为止，我已经测试了三个区域，堆、堆栈和常量(只读)内存。在我的测试中，常量内
不使用 memcpy() 复制字节
这是一项家庭作业。我想实现 memcpy()。有人告诉我内存区域不能重叠。其实我不明白那是什么意思，因为这段代码工作正常，但是有内存重叠的可能性。如何预防？ void *mem_copy(void *
c - memcpy 启动索引真的需要吗？
问题是，当我们使用 memcpy() 复制任何字节数组时，我们应该明确声明目标缓冲区的起始(第 0 个)索引，还是简单地提及它就足够了。让我展示我在说什么的例子。假设我们正在尝试将源缓冲区复制到目标缓
c memcpy 按值结构
我只是想将一个结构复制到另一个结构(按值复制，而不是按引用复制)。这是完整的工作代码 /* memcpy example */ #include #include #include #defin

首页

博学

6Ren·AI

商城

performance - 原子 memcpy 建议