- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
Microsoft's documention of Parallel.For包含以下方法:
static void MultiplyMatricesParallel(double[,] matA, double[,] matB, double[,] result)
{
int matACols = matA.GetLength(1);
int matBCols = matB.GetLength(1);
int matARows = matA.GetLength(0);
// A basic matrix multiplication.
// Parallelize the outer loop to partition the source array by rows.
Parallel.For(0, matARows, i =>
{
for (int j = 0; j < matBCols; j++)
{
double temp = 0;
for (int k = 0; k < matACols; k++)
{
temp += matA[i, k] * matB[k, j];
}
result[i, j] = temp;
}
}); // Parallel.For
}
在这个方法中,可能有多个线程从 matA
和 matB
中读取值,它们都是在调用线程上创建和初始化的,并且可能有多个线程将值写入 result
,稍后由调用线程读取。在传递给 Parallel.For
的 lambda 中,数组读写没有显式锁定。因为此示例来自 Microsoft,所以我假设它是线程安全的,但我试图了解幕后发生的事情以使其成为线程安全的。
根据我阅读的内容和我在 SO 上提出的其他问题(例如 this one ),据我所知,需要几个内存屏障才能使这一切正常进行。它们是:
matA
和 matB
之后调用线程上的内存屏障,matA
和 matB
读取值之前,每个非调用线程上的内存屏障,result
之后,每个非调用线程上的内存屏障,以及result
中读取值之前调用线程上的内存屏障。我的理解正确吗?
如果是这样,Parallel.For
是否以某种方式完成所有这些?我深入研究了引用资料,但在跟踪 the code 时遇到了麻烦。 .我没有看到任何 lock
block 或 MemoryBarrier
调用。
最佳答案
由于数组已经创建,写入或读取它不会导致任何调整大小。此外,代码本身会阻止读取/写入数组中的相同位置。
最重要的是,代码始终可以计算数组中读取和写入的位置,并且这些调用永远不会相互交叉。因此,它是线程安全的。
关于c# - Parallel.For 中的内存屏障,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41653826/
我有一个使用临界区的 Windows DLL(C 语言)。多次调用的特定例程需要在第一次调用时执行一些初始化代码,因此我使用了临界区。但是,由于它被调用了很多次,我试图避免每次调用时都进入该部分的开销
我想确保正确实现障碍。现在,每次调用 amStaticThreaded 时都会启动大量新线程。在我的主例程中,amStaticThreaded 之后的所有事情都只能由一个线程完成,但那部分速度非常快。
我想实现自定义 Java 屏障。我不想使用 CyclicBarrier class . 所以所有线程都在一个公共(public)点相遇。只有当所有线程都到达屏障时,线程才会继续。 我想使用 wait/
您好,很抱歉发布了一大堆代码,但我对 C 代码还很陌生,基本上我正在做一项大学作业,我必须实现一个“pthread_barrier”,现在我理解了屏障的概念(或者至少我认为我这样做)但我只是不确定我应
什么是boost:barrier,如何使用这种boost方法。你能不能给我一个清楚的例子,因为我找到了下面的例子: bool wait() { boost::mutex
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
所以这是代码: #pragma omp parallel private (myId) { set_affinity(); myId = omp_get_thread_num(); if
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
我正在尝试创建一个 C 代码来对具有多个线程的数组进行排序,因此我需要使用屏障来同步威胁 void sort(struct ThreadArguments* args){ struct
这些天我正在阅读有关内存栅栏和屏障的内容,作为同步多线程代码和避免代码重新排序的一种方法。 我通常在 Linux 操作系统下使用 C++ 进行开发,并且大量使用 boost 库,但我找不到任何与之相关
我正在编写一个 SMT 程序,并且正在尝试解决一个有趣的问题。 我需要所有函数一起退出,但是有些线程卡在障碍物上,即使我不希望它们这样做。 我的问题是:当我删除障碍时会发生什么?卡在屏障处的线程会释放
可能是我没有理解线程的屏障概念。但是我写了一段代码,我想了解它是否正确使用了 barrier。 代码如下: #!/usr/bin/env python3 # -*- coding: utf-8 -*-
我想编写可移植代码(Intel、ARM、PowerPC...)来解决一个经典问题的变体: Initially: X=Y=0 Thread A: X=1 if(!Y){ do something
我有一个 n 的二维网格x n元素。在一次迭代中,我通过平均相邻元素的值来计算一个元素的值。即: for(int i=0;i
我是 MPI 新手,在尝试使用障碍时遇到了 fatal error 。我有一个简单的 for 循环,它以循环方式将索引分配给每个进程,紧随其后的是 MPI 屏障: mpi.cc #include #
我正在使用 gdrive和 gshell为了与我的 Google 帐户交互并下载文件,请获取他们的信息。 当我运行时:gdrive about或 gdown about ,我收到以下消息 Initia
运行以下代码时,2个启动线程将被CyclicBarrier *对象锁定,并无限等待第三个线程解锁 import java.util.concurrent.BrokenBarrierException;
我是一名优秀的程序员,十分优秀!