c++ - 并行 libstdc++ 模式不对迭代器使用并行 for

c++ - 并行 libstdc++ 模式不对迭代器使用并行 for_each 算法

转载作者：行者123 更新时间：2023-11-30 05:23:59

26

4

我正在研究 Barnes-Hut-Algorithm 的并行 STL 实现。

对于性能问题，我想尝试 libstdc++ 中某些算法的并行模式 https://gcc.gnu.org/onlinedocs/libstdc++/manual/parallel_mode.html

此扩展也将随新的 C++17 标准一起提供。

为了计算每个物体的有效加速度，我使用 for_each来自命名空间 __gnu_parallel 的算法.要使用顺序算法，可以将其替换为 std .

为了编译程序，我使用 5.4.0 版的 g++ 并通过 g++-5 -fopenmp -O0 -g -Wall -fmessage-length=0 -std=c++1z -c -o BarnesHutCPU.o BarnesHutCPU.cpp 调用它。对于并行算法，使用 OpenMP。这就是 -fopenmp 的原因.

但是for_each的顺序和并行使用的时间几乎相同。当你调用 omp_get_num_threads()在for_each循环，你明白了整个循环只使用一个线程的原因。

所以我的问题是:为什么算法不是并行执行的，我需要做什么才能并行执行？我也试过 OMP_NUM_THREADS=4 ./BarnesHutCPU .

我不想使用普通的 for循环，因为我必须使用 STL 算法。 (一个原因是，我以后想用Thrust)

这是 N=750 的重要代码部分:

void calcAcc()
{
    double theta = 0.5; 
    __gnu_parallel::for_each(counting_iterator<int>(0), counting_iterator<int>(N), [&](const int &i){
        ...
    }
}

counting_iterator<T>来自boost::counting_iterator<T>

问候语托梅克

最佳答案

好的，原因是 -O0 标志。使用 -O3 它使用我的 4 个 CPU，我也可以在系统监视器中看到。起初我没有看到任何效果，因为我的 N 太小了。

感谢您的帮助!

关于c++ - 并行 libstdc++ 模式不对迭代器使用并行 for_each 算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38923542/

26

4

0

文章推荐： Facebook Secure Canvas URL 要求和遗留应用程序

文章推荐： java - 子集和问题: Returning a Variant of the Required Subset

c++ - for_each(for_each())？
这行得通，for_each 传递 vector std::vector v(10, 1); std::vector > vv(10, v); auto vvit = vv.begin(); std::
Terraform for_each for nested value(嵌套值的TerraForm For_Each)
主要思想是在GitHub存储库中为一个环境(生产和开发)创建多个env_var。。使用这些变量，我可以遍历每个变量。Key键是环境名称。但是，我需要认识到如何迭代嵌套的值。我需要使用什么来代替loca
terraform - 使用 for_each 创建的资源中带有 for_each 的动态 block
我正在尝试使用 Terraform 0.12+ 及其新的 for_each 在 Azure 中构建多个 vnet，但遇到了一些麻烦。我希望新功能能够让我创建一个接收复杂变量的通用网络模块，但我可能已经
c++ - boost::fusion::for_each 中的函数对象不同于 std::for_each
在升级到更新的编译器并解决编译器错误时，我意识到 boost::fusion::for_each 要求传入的函数对象具有运算符 const。示例来自 Boost : struct increment
c++ - 并行 for_each 比 std::for_each 慢两倍以上
我正在阅读 C++ Concurrency in Action 安东尼·威廉姆斯。在关于设计并发代码的章节中有并行版本的std::for_each。算法。这是本书中略微修改的代码: join_thre
c++ - 为什么 std::for_each 比 __gnu_parallel::for_each 快
我试图理解为什么在单线程上运行的 std::for_each 比 __gnu_parallel::for_each 快 ~3 倍在下面的示例中: Time =0.478101 milliseconds
azure - terraform 模块 block 中的 for_each 返回 - "for_each"参数值不合适
我想在模块 block 中使用 count，但由于不支持它，我尝试使用 for 循环编写 for_each 但它给出了 “for_each”参数值不合适错误。我无法将计数传递给内部模块，因为它会弄
amazon-web-services - Terraform 因无效的 for_each 参数而失败/给定的 "for_each"参数值不合适
运行时terraform plan或 terraform apply提供给 for_each 的列表发生错误说 Error: Invalid for_each argument on main.t
class - 将类成员函数传递给 for_each
我的问题是:如何将类成员函数传递给 for_each 我试图开始工作的代码:(在类外定义函数时有效) 失败的部分被注释掉了——使用for_each函数作为类成员函数的部分关于如何让它工作有什么建议吗
c++ - for_each 奇怪的行为
我不太使用 STL，但我想开始学习它，所以我使用 STL 的 for_each 函数编写了一个非常简单的程序。这是整个程序(减去头文件): class Object { public: int
c++ - for_each 打印数据不正确
我现在正在学习 OpenCL，并且正在尝试编写一个“hello world”示例；我创建平台、设备和环境。现在我想从设备获取设备信息，以便我创建信息并将其保存在 vector 中，然后打印它们。为此
c++ - 如何使用带有附加参数的 for_each？
我想弄清楚 for_each() 是如何使用的。首先，我改造了这个循环 for(int i = 0; i < myvector.size(); ++i){ myvector[i].a.b. =
C++ for_each 算法和字符串
我正在尝试使用 for_each 遍历字符串的每个字母， std::unordered_map dico; std::for_each(str.begin(),str.end(),[&](std::s
c++ for_each 并行处理两个容器
我想处理 2 个以某种方式相关的容器，并且我想处理它们之间的元素。简单的例子:一个容器包含某种总和，另一个等长的容器包含必须从该总和中减去的数字。 std::vector s = {20,56,7,
c++ - For_each 和指向成员函数的指针
我遇到了以下代码的问题: #include #include #include #include #include using namespace std; struct Person {
C++ for_each() 和函数指针
我试图让 myFunction 给我数组中值的总和，但我知道我不能使用返回值，当我用代码运行我的程序时，我得到的只是一个打印输出的值，没有总和，这是为什么？ void myFunction (int
c++ - for_each 避免原始循环
我正在尝试使用 STL 算法 (C++11) 重写我的一些代码，但我陷入了“无原始循环”规则。我的一个函数中有这段代码: for (size_t i = 0; i size(); i++) {
c++ - for_each 中的类方法
有类和事件结构: struct Foo { Foo(): name("nx"), val(9) {} string name; int val; }; class Base {
c++ - for_each 中使用的函数的默认值
我尝试将 for_each 与 boost::trim 一起使用。首先我用错了代码 std::for_each(v.begin(),v.end(),&boost::trim)); // error
c++ - `for_each` 没有像我预期的那样工作
我正在尝试函数式编程的一些功能，并尝试为 vector 中的每个对象调用一个成员函数。到目前为止，这是我的代码。 emplace.cc #include #include #include #i

首页

博学

6Ren·AI

商城

c++ - 并行 libstdc++ 模式不对迭代器使用并行 for_each 算法