gpt4 book ai didi

c# - 在嵌套循环中,Parallel.For 应该用在外循环还是内循环?

转载 作者:行者123 更新时间:2023-11-30 16:23:18 24 4
gpt4 key购买 nike

我正在将一些代码从 .NET 2 转移到 4,并在其他方面使用 TPL。

虽然我确定这个问题一定是在 SO 的某个地方被问到的,但我找不到它。

我知道过度嵌套 TPL 任务可能会影响性能。

for (int y=0; y < h; y++)
for (int x=0; x < w; x++)
grid [x, y] = ((x + 1) * (y + 1));

你会用上面的外循环或内循环代替 TPL 吗?为什么?如果有额外的嵌套级别呢?

这里是替换了内循环的代码,在我的例子中,它的表现更好了多达 1 秒。

int w = 10000;
int h = 10000;
int [,] grid = new int [w, h];
int [] index = new int [w * h];
DateTime time = DateTime.Now;
ParallelOptions options = new ParallelOptions();

options.MaxDegreeOfParallelism = Environment.ProcessorCount;

time = DateTime.Now;
for (int y=0; y < h; y++)
{
Parallel.For
(
0,
w,
options,
x =>
{
grid [x, y] = ((x + 1) * (y + 1));
}
);
}
span = DateTime.Now.Subtract(time);
Console.WriteLine("Filled in " + span.TotalSeconds.ToString() + " seconds.");

time = DateTime.Now;
for (int y=0; y < h; y++)
{
Parallel.For
(
0,
w,
options,
(x, state) =>
{
if (grid [x, y] < index.Length)
{
index [grid [x, y]]++;
}
else
{
state.Break();
}
}
);
}
span = DateTime.Now.Subtract(time);
Console.WriteLine("Indexed in " + span.TotalSeconds.ToString() + " seconds.");

最佳答案

当并行化内部循环时,您会看到更好的性能,因为 rect[x,] 在内存中与 rect[x+1,] 相邻,而 rect [,y]rect[,y+1] 不相邻,因此并行化外部循环将导致对相同内存空间的更多争用并降低速度。

除此之外,parrelleizing 外循环应该更快,所以如果你切换内循环和外循环然后在外循环上执行 Parallel.For ,你应该获得比任何一个都更好的性能您当前的测试。

另一件值得注意的事情是边界检查有些昂贵,因此您还可以通过使用不安全的代码/指针而不是遍历大型数组来提高性能。

关于c# - 在嵌套循环中,Parallel.For 应该用在外循环还是内循环?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11711985/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com