- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试编写一个无互斥(但不是无锁)队列,它使用连续的内存范围作为循环缓冲区和四个指针:两个用于消费者,两个用于生产者。它在最新推送的元素之后保留一个空格,以消除满队列和空队列之间的歧义。这是实现:
template <typename T, typename Allocator = std::allocator<T>>
class concurrent_queue
{
protected:
T *storage;
std::size_t s;
std::atomic<T*> consumer_head, producer_head;
union alignas(16) dpointer
{
struct
{
T *ptr;
std::size_t cnt;
};
__int128 val;
};
dpointer consumer_pending, producer_pending;
Allocator alloc;
public:
concurrent_queue(std::size_t s): storage(nullptr), consumer_head(nullptr), producer_head(nullptr)
{
storage = alloc.allocate(s+1);
consumer_head = storage;
__atomic_store_n(&(consumer_pending.val), (dpointer{storage, 0}).val, __ATOMIC_SEQ_CST);
producer_head = storage;
__atomic_store_n(&(producer_pending.val), (dpointer{storage, 0}).val, __ATOMIC_SEQ_CST);
this->s = s + 1;
}
~concurrent_queue()
{
while(consumer_head != producer_head)
{
alloc.destroy(consumer_head.load());
++consumer_head;
if(consumer_head == storage + s)
consumer_head = storage;
}
alloc.deallocate(storage, s);
}
template <typename U>
bool push(U&& e)
{
while(true)
{
dpointer a;
a.val = __atomic_load_n(&(producer_pending.val), __ATOMIC_RELAXED);
std::atomic_thread_fence(std::memory_order_acquire);
auto b = consumer_head.load(std::memory_order_relaxed);
auto next = a.ptr + 1;
if(next == storage + s) next = storage;
if(next == b) continue;
dpointer newval{next, a.cnt+1};
if(!__atomic_compare_exchange_n(&(producer_pending.val), &(a.val), (newval.val), true, __ATOMIC_ACQUIRE, __ATOMIC_RELAXED)) continue;
alloc.construct(a.ptr, std::forward<U>(e));
while(!producer_head.compare_exchange_weak(a.ptr, next, std::memory_order_release, std::memory_order_relaxed));
return true;
}
}
template <typename U>
bool pop(U& result)
{
while(true)
{
dpointer a;
a.val = __atomic_load_n(&(consumer_pending.val), __ATOMIC_RELAXED);
std::atomic_thread_fence(std::memory_order_acquire);
auto b = producer_head.load(std::memory_order_relaxed);
auto next = a.ptr + 1;
if(next == storage + s) next = storage;
if(a.ptr == b) continue;
dpointer newval{next, a.cnt+1};
if(!__atomic_compare_exchange_n(&(consumer_pending.val), &(a.val), (newval.val), true, __ATOMIC_ACQUIRE, __ATOMIC_RELAXED)) continue;
result = std::move(*(a.ptr));
alloc.destroy(a.ptr);
while(!consumer_head.compare_exchange_weak(a.ptr, next, std::memory_order_release, std::memory_order_relaxed));
return true;
}
}
};
然而,当使用相同数量的独立推送和弹出线程进行测试时,每个推送/弹出相等的、预定数量的元素在终止之前,一些弹出线程有时(不总是)卡在第一个 CAS 处执行中的某个点并且永远不会终止,即使在所有推送线程终止之后也是如此。由于它们尝试弹出与推送线程推送的元素数量相同的元素,因此我怀疑在某个时候推送线程中发生了覆盖。
这是我第一次尝试编写并发容器,所以我对此非常缺乏经验......我已经盯着它看了一段时间,但一直没能弄清楚哪里出了问题。对此更有经验的人可以发现问题吗?
此外,是否有任何平台特定的方式来获得双倍宽度的 CAS?
最佳答案
编辑: 大多数内容是这篇文章实际上是错误的。查看评论。
dpointer a;
a.val = __atomic_load_n(&(producer_pending.val), __ATOMIC_RELAXED);
std::atomic_thread_fence(std::memory_order_acquire);
auto b = consumer_head.load(std::memory_order_relaxed);
您绝对确定这会按照您的想法行事吗?此代码段不将 a.val 排在 b 之前。
std::atomic_thread_fence(std::memory_order_acquire);保证在栅栏之后 的内存读取操作不会在栅栏之前 重新排序。但是没有什么能阻止栅栏上方的内存操作流到栅栏下方。编译器可以完全自由地将获取栅栏向上移动到它想要的位置,只要它不与其他栅栏重新排序即可。
更抽象:
a = load relaxed
memory fence acquire -- memory operations below this line may not float upwards
b = load relaxed
这个编译器可能会把它转换成这样:
memory fence acquire
b = load relaxed
a = load relaxed
但不是这个:
a = load relaxed
b = load relaxed
memory fence acquire
此外,您应该真正避免内存栅栏,并在操作本身上添加获取/释放。这通常会为非 x86 目标生成更好的代码。对于 x86,这并不重要,因为在各种情况下,即使是普通的 mov
也足以提供顺序一致性。
关于c++ - 在并发队列中覆盖,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24087577/
我正在尝试在多线程环境中实现某种累积逻辑;我想知道没有 lock 和 synchronized 关键字是否有更好/更快的方法来做到这一点?以下是我当前的代码: public class Concurr
我需要帮助构建一个实现信号量的监视器,简单的 C 示例就可以。 这是为了证明可以在任何可以使用信号量的地方使用监视器。 最佳答案 如果您说允许使用互斥锁/condvars,请检查: #include
我已经构建了一些返回部分产品目录的 ajax,并且我正在尝试将 xml 输出到文档中,到目前为止,这是我所拥有的: $("#catalog").append("Item NamePriceDe
很抱歉,如果我的问题之前已经被问过,或者它太明显了,但我真的需要澄清这一点。感谢您的帮助。 在多用户界面中,如果来自不同用户的相同事务同时到达服务器,会发生什么? 我有下一张表: create tab
这可能是一个愚蠢的问题,但是这个程序的输出(它的方式)可以为零吗? public class Test2{ int a = 0; AtomicInteger b = new Atomi
假设我本地主机上的一个网站处理每个请求大约需要 3 秒。这很好,正如预期的那样(因为它在幕后进行了一些奇特的网络)。 但是,如果我在选项卡(在 firefox 中)中打开相同的 url,然后同时重新加
我对 MongoDB 的读锁定有点困惑。单个集合可以支持多少个并发读取操作? 最佳答案 如 tk 给出的链接中所写:http://www.mongodb.org/pages/viewpage.acti
如果有四个并发的 CUDA 应用程序在一个 GPU 中竞争资源会发生什么这样他们就可以将工作卸载到图形卡上了? Cuda Programming Guide 3.1 提到那里 某些方法是异步的: 内核
👊上次的百度面试遇到了关于spark的并发数的问题,今天我们就来将这些问题都一并解决一下,图画的的有点丑,还行大家见谅,百度实习的问题我放在了下面的链接👇: 链接: 2022百度大数据开发工程师实
我对 Groovy 线程有疑问。 我的任务是以某种方式翻译给定目录中的每个文件 并将生成的输出放在其他目录中的文件中。 我编写了以下代码,该代码有效: static def translateDir(
Java中的同步和锁定有什么区别? 最佳答案 synchronized是语言关键字;锁是对象。 当一个方法或代码块被标记为同步时,您是说该方法或代码块必须先获得某个锁对象(可以在同步的语法中指定)才能
我需要创建一个能够同时处理来自客户端的多个请求的并发 RPC 服务器。 使用 rpcgen linux编译器(基于sun RPC),不支持-A为并发服务器创建 stub 的选项。 (-A 选项在 so
System.out.println("Enter the number of what you would like to do"); System.out.println("1 = Manuall
我正在将我的应用程序移植到 iOS 8.0 并注意到 UIAlertView 已被弃用。 所以我改变了使用 UIAlertController 的方法。这在大多数情况下都有效。 除了,当我的应用程序打
我正在逐行同时读取两个文本文件。 我特别想做的是当lineCount在每个线程上都是相同的我想看看扫描仪当前正在读取的字符串。 我环顾四周寻找可以实现的某些模式,例如 Compare and Swap
我正在阅读 Java Concurrency in Practice .在章节中断政策部分 取消和关闭 它提到 A task should not assume anything about the
我正在尝试学习线程,互斥等的基础知识。遵循here的文档和示例。在下面的代码中,我得到预期的输出。问题: 想确认我是否有任何陷阱?我们如何改善下面的代码? 我的线程在哪一行尝试获取互斥锁或正在等待互斥
并发是指两个任务在不同的线程上并行运行。但是,异步方法并行运行,但在同一个线程上。这是如何实现的?另外,并行性怎么样? 这三个概念有什么区别? 最佳答案 并发和并行实际上与您正确推测的原理相同,两者都
以此ConcurrentDouble类定义为例: public class ConcurrentDouble { public double num = 0; public void subt
在得知并发确实增加了许多人的吞吐量后,我一直计划在项目中使用并发。现在我在多线程或并发方面还没有做太多工作,因此决定在实际项目中使用它之前学习并进行简单的概念验证。 以下是我尝试过的两个示例: 1.
我是一名优秀的程序员,十分优秀!