gpt4 book ai didi

c++ - OpenMP shared vs. firstprivate performancewise

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:19:55 24 4
gpt4 key购买 nike

我在类方法中有一个#pragma omp parallel for 循环。每个线程只读访问很少的方法局部变量,很少调用私有(private)数据和方法的参数。所有这些都在 shared 子句中声明。我的问题:

  • 性能方面应该没有任何区别声明这些变量 sharedfirstprivate。对吧?
  • 如果我不小心让变量不共享相同的缓存行,是否也是如此?
  • 如果其中一个共享变量是一个指针,并且在线程内我通过它读取一个值,是否存在像普通循环中那样的别名问题?

明天我将尝试分析我的代码。同时感谢您的建议!

最佳答案

  1. 嗯,它们不是一回事。使用shared,它们在所有线程之间共享。使用 firstprivate,每个线程都有自己的拷贝。如果您只是读取变量,那么最好将其保留为 shared 以避免复制它。 (在 C++ 中,firstprivate 将隐式调用复制构造函数。)

  2. 正确,多个线程读取和写入位于同一缓存线上的值称为 false sharing .缓存行将在访问它的内核之间来回反弹 - 如果这种情况发生得足够频繁,可能会导致速度显着下降。

  3. 如果您只是通过共享指针读取数据,那么应该没有问题。但是,如果您还向其写入数据,则需要确保您没有竞争条件。

关于c++ - OpenMP shared vs. firstprivate performancewise,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7865555/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com