c# - Parallel.For 中的内存屏障-6ren

c# - Parallel.For 中的内存屏障

转载作者：太空狗更新时间：2023-10-29 20:53:57

24

4

Microsoft's documention of Parallel.For包含以下方法:

static void MultiplyMatricesParallel(double[,] matA, double[,] matB, double[,] result)
{
    int matACols = matA.GetLength(1);
    int matBCols = matB.GetLength(1);
    int matARows = matA.GetLength(0);

    // A basic matrix multiplication.
    // Parallelize the outer loop to partition the source array by rows.
    Parallel.For(0, matARows, i =>
    {
        for (int j = 0; j < matBCols; j++)
        {
            double temp = 0;
            for (int k = 0; k < matACols; k++)
            {
                temp += matA[i, k] * matB[k, j];
            }
            result[i, j] = temp;
        }
    }); // Parallel.For
}

在这个方法中，可能有多个线程从 matA 和 matB 中读取值，它们都是在调用线程上创建和初始化的，并且可能有多个线程将值写入 result，稍后由调用线程读取。在传递给 Parallel.For 的 lambda 中，数组读写没有显式锁定。因为此示例来自 Microsoft，所以我假设它是线程安全的，但我试图了解幕后发生的事情以使其成为线程安全的。

根据我阅读的内容和我在 SO 上提出的其他问题(例如 this one )，据我所知，需要几个内存屏障才能使这一切正常进行。它们是:

在创建和初始化 matA 和 matB 之后调用线程上的内存屏障，
在从 matA 和 matB 读取值之前，每个非调用线程上的内存屏障，
在将值写入result 之后，每个非调用线程上的内存屏障，以及
在从 result 中读取值之前调用线程上的内存屏障。

我的理解正确吗？

如果是这样，Parallel.For 是否以某种方式完成所有这些？我深入研究了引用资料，但在跟踪 the code 时遇到了麻烦。 .我没有看到任何 lock block 或 MemoryBarrier 调用。

最佳答案

由于数组已经创建，写入或读取它不会导致任何调整大小。此外，代码本身会阻止读取/写入数组中的相同位置。

最重要的是，代码始终可以计算数组中读取和写入的位置，并且这些调用永远不会相互交叉。因此，它是线程安全的。

关于c# - Parallel.For 中的内存屏障，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41653826/

24

4

0

文章推荐： python - 使用 ElementTree 的递归 XML 解析 python

文章推荐：使用相同的纯虚方法从不同的抽象基础进行 C++ 多重继承

文章推荐： c++ - 禁用模板但允许特化

多处理器系统上的临界区和内存栅栏/屏障
我有一个使用临界区的 Windows DLL(C 语言)。多次调用的特定例程需要在第一次调用时执行一些初始化代码，因此我使用了临界区。但是，由于它被调用了很多次，我试图避免每次调用时都进入该部分的开销
c++ - 如何使用 OpenMP 屏障
我想确保正确实现障碍。现在，每次调用 amStaticThreaded 时都会启动大量新线程。在我的主例程中，amStaticThreaded 之后的所有事情都只能由一个线程完成，但那部分速度非常快。
java - 实现自定义 Java 屏障
我想实现自定义 Java 屏障。我不想使用 CyclicBarrier class . 所以所有线程都在一个公共(public)点相遇。只有当所有线程都到达屏障时，线程才会继续。我想使用 wait/
c - 如何使用 pthreads 屏障？
您好，很抱歉发布了一大堆代码，但我对 C 代码还很陌生，基本上我正在做一项大学作业，我必须实现一个“pthread_barrier”，现在我理解了屏障的概念(或者至少我认为我这样做)但我只是不确定我应
c++ - 如何使用 boost 屏障
什么是boost:barrier，如何使用这种boost方法。你能不能给我一个清楚的例子，因为我找到了下面的例子: bool wait() { boost::mutex
openmp - cython openmp 单，屏障
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
OpenMP 线程 "disobey"omp 屏障
所以这是代码: #pragma omp parallel private (myId) { set_affinity(); myId = omp_get_thread_num(); if
openmp - cython openmp 单，屏障
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
c - C 中的 Pthread 屏障
我正在尝试创建一个 C 代码来对具有多个线程的数组进行排序，因此我需要使用屏障来同步威胁 void sort(struct ThreadArguments* args){ struct
multithreading - C++ 中的内存栅栏/屏障 : does boost or other libraries have them?
这些天我正在阅读有关内存栅栏和屏障的内容，作为同步多线程代码和避免代码重新排序的一种方法。我通常在 Linux 操作系统下使用 C++ 进行开发，并且大量使用 boost 库，但我找不到任何与之相关
c - 关于 PThread 和 PThread 屏障
我正在编写一个 SMT 程序，并且正在尝试解决一个有趣的问题。我需要所有函数一起退出，但是有些线程卡在障碍物上，即使我不希望它们这样做。我的问题是:当我删除障碍时会发生什么？卡在屏障处的线程会释放
Python/线程/屏障 : Is this a correct usage of Barrier?
可能是我没有理解线程的屏障概念。但是我写了一段代码，我想了解它是否正确使用了 barrier。代码如下: #!/usr/bin/env python3 # -*- coding: utf-8 -*-
c++ - 如何在 C++11 中实现 StoreLoad 屏障？
我想编写可移植代码(Intel、ARM、PowerPC...)来解决一个经典问题的变体: Initially: X=Y=0 Thread A: X=1 if(!Y){ do something
c++ - 是否可以为并行区域中的共享二维数组创建选择元素的线程本地拷贝？ (共享、私有(private)、屏障 : OPenMP)
我有一个 n 的二维网格x n元素。在一次迭代中，我通过平均相邻元素的值来计算一个元素的值。即: for(int i=0;i
c++ - 为什么我会收到使用 MPI 屏障 [c++] 的 fatal error
我是 MPI 新手，在尝试使用障碍时遇到了 fatal error 。我有一个简单的 for 循环，它以循环方式将索引分配给每个进程，紧随其后的是 MPI 屏障: mpi.cc #include #
api - 如何处理 “App is temporarily blocked from logging in with your Google account” 屏障
我正在使用 gdrive和 gshell为了与我的 Google 帐户交互并下载文件，请获取他们的信息。当我运行时:gdrive about或 gdown about ，我收到以下消息 Initia
java - 当通过屏障(例如 CyclicBarrier)的线程数量小于屏障限制时，屏障(例如 CyclicBarrier)是否会导致死锁？
运行以下代码时，2个启动线程将被CyclicBarrier *对象锁定，并无限等待第三个线程解锁 import java.util.concurrent.BrokenBarrierException;

首页

博学

6Ren·AI

商城

c# - Parallel.For 中的内存屏障