- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我对两个程序进行了一些比较,这两个程序使用梅森扭曲器中的伪随机整数填充给定的 vector ,关键是 TBB 版本非常慢,std 版本在大约 0.6 秒内执行任务当TBB至少需要1.1s时。
我还注意到 TBB 并没有真正提供优化的算法来处理容器,但它只提供通用构造(parallel_for、parallel_for_each 和类似的)来处理 std 提供的通用任务 std::generate
在这种情况下,这是一个更好、更清晰的解决方案。
您可以在此处下载我的小测试,其中包含 2 个小源文件 + 用于 gcc 的 Makefile http://www.sendspace.com/file/ew73h8
我这里做错了什么?我增加这个 vector 的大小越多,TBB 就越慢,我在 Ubuntu 13.04 64 位和 Intel Q6600 下。
TBB 版本在某些方面可能会更好?
编辑:2 个文件的完整来源
config.hpp
#define N 10000000
标准.cpp
#include <random>
#include <iostream>
#include <vector>
#include <algorithm>
#include "config.hpp"
int main() {
std::vector<u_int32_t> v(N);
std::mt19937 mt;
std::uniform_int_distribution<u_int32_t> dist(0,499);
std::generate(v.begin(),v.end(),[&]{return dist(mt);});
return(0);
}
tbb.cpp
#include <tbb/concurrent_vector.h>
#include <tbb/parallel_for_each.h>
#include <random>
#include <iostream>
#include "config.hpp"
int main()
{
tbb::concurrent_vector<u_int32_t> v(N);
std::mt19937 mt;
std::uniform_int_distribution<u_int32_t> dist(0, 499);
tbb::parallel_for_each(v.begin(),v.end(),[&](u_int32_t& e){e = dist(mt); });
return(0);
}
最佳答案
您正在为 ITBB 将控制的所有工作人员共享随机数生成器 (RNG),正如我从您的问题中看到的那样,这将是四个。撇开从多个线程改变 RNG 状态的线程安全问题不谈,我会指出对缓存的影响:从四个处理器读取和写入访问 RNG 状态使用的相同内存,这很可能是使缓存无用。
让我们试试这个:
#include <tbb/concurrent_vector.h>
#include <tbb/parallel_for_each.h>
#include <vector>
#include <functional>
#include <random>
#include <iostream>
#include "config.hpp"
static thread_local std::mt19937 mt;
static thread_local std::uniform_int_distribution<u_int32_t> dist(0, 499);
int main()
{
std::vector<u_int32_t> v(N);
auto f = [&v](std::pair<u_int32_t, u_int32_t> const& p) {
for (size_t i=p.first; i < p.second; i++)
{
v[i] = dist( mt );
}
};
std::vector< std::pair< u_int32_t, u_int32_t > > work;
work.push_back( std::make_pair( 0, N/2) );
work.push_back( std::make_pair( N/2, N) );
tbb::parallel_for_each(
work.begin(),
work.end(),
f
);
return(0);
}
现在时间减少到标准版本的近一半(我只有双核)。代码所做的是强制 itbb 在连续的内存块中工作,而不是分发数据,而是分发工作分配。我不认为这是使用 ITBB 的最佳方式,但另一方面 parallel_for_each 不能以 block 大小提供(从我在 docs 中看到的),而使用 *parallel_for* 需要一些研究。但这并不难:
#include <tbb/concurrent_vector.h>
#include <tbb/parallel_for.h>
#include <vector>
#include <functional>
#include <random>
#include <iostream>
#include "config.hpp"
static thread_local std::mt19937 mt;
static thread_local std::uniform_int_distribution<u_int32_t> dist(0, 499);
int main()
{
std::vector<u_int32_t> v(N);
auto f = [&v](const tbb::blocked_range<u_int32_t>& p) {
for (auto i=p.begin(); i < p.end(); i++)
{
v[i] = dist( mt );
}
};
tbb::parallel_for(
tbb::blocked_range<u_int32_t>(0,N),
f
);
return(0);
}
不使用 ITBB,您可能想在 OpenMP 中使用一些并行结构,无论如何它已经与 gcc 捆绑多年(并且您仍然可以将 ITBB 与 OpenMP 一起使用,但要小心)。
随机数和并行代码呢?他们很乱。如果您想独立地为 RNG 播种并计时,上面的代码可能就足够了。如果您想获得可重现的结果和不相关的 RNG,那么您必须注意每个生成器都由特定于线程的种子初始化,并且您还需要一种方法让每个种子通过其线程接触确定性部分工作...
关于c++ - 英特尔 TBB 比标准慢 2 倍 - tbb vs std,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17252402/
我正在开发一个小型图书馆,我需要做的一件事是让访问者访问一些数据并返回结果。 在一些较旧的 C++ 代码中,访问者需要声明一个 typedef return_type .例如,boost::stati
我正在尝试使用std:map类型的键和值制作std::any Visual Studio 2017 std::map m("lastname", "Ivanov"); std::cout (m["la
我已经在 C++ 的 map 中声明了一个集合为 std::map> .如何循环访问或打印设定值? 最佳答案 如果你知道如何迭代 std::map或 std::set单独地,您应该可以毫无问题地组合迭
如何循环? 我已经试过了: //----- code std::vector >::iterator it; for ( it = users.begin(); it != users.end();
我有两个用例。 A.我想同步访问两个线程的队列。 B.我想同步两个线程对队列的访问并使用条件变量,因为其中一个线程将等待另一个线程将内容存储到队列中。 对于用例 A,我看到了使用 std::lock_
我正在查看这两种类型特征的文档,但不确定有什么区别。我不是语言律师,但据我所知,它们都适用于“memcpy-able”类型。 它们可以互换使用吗? 最佳答案 不,这些术语不能互换使用。这两个术语都表示
我有以下测试代码,其中有一个参数 fS,它是 ofstream 的容器: #include #include #include #include int
这是这个问题的延续 c++ function ptr in unorderer_map, compile time error 我试图使用 std::function 而不是函数指针,并且只有当函数是
std::unordered_map str_bool_map = { {"a", true}, {"b", false}, {"c", true} }; 我们可以在此映射上使
我有以下对象 std::vector> vectorList; 然后我添加到这个使用 std::vector vec_tmp; vec_tmp.push_back(strDRG); vec_tmp.p
为什么 std::initializer_list不支持std::get<> , std::tuple_size和 std::tuple_element ?在constexpr中用得很多现在的表达式,
我有一个像这样定义的变量 auto drum = std::make_tuple ( std::make_tuple ( 0.3f , Ex
假设我有一个私有(private)std::map在我的类(class)里std::map 。我怎样才能将其转换为std::map返回给用户?我想要下面的原型(prototype) const std
假设我有一个私有(private)std::map在我的类(class)里std::map 。我怎样才能将其转换为std::map返回给用户?我想要下面的原型(prototype) const std
问题 我正在尝试将 lambda 闭包传递给 std::thread,它使用任意封闭参数调用任意封闭函数。 template std::thread timed_thread(Function&& f
我想创建一个模板类,可以容纳容器和容器的任意组合。例如,std::vector或 std::map ,例如。 我尝试了很多组合,但我必须承认模板的复杂性让我不知所措。我编译的关闭是这样的: templ
我有一个 std::vector>我将其分配给相同类型的第二个 vector 。 我收到这个编译器错误: /opt/gcc-8.2.0/include/c++/8.2.0/bits/stl_algob
有时候,我们有一个工厂可以生成一个 std::unique_ptr vector ,后来我们想在类/线程/你命名的之间共享这些指针。因此,最好改用 std::shared_ptr 。当然有一种方法可以
这个问题在这里已经有了答案: Sorting a vector of custom objects (14 个答案) 关闭 6 年前。 我创建了一个 vector vector ,我想根据我定义的参
我有三个类(class)成员: public: std::vector > getObjects(); std::vector > getObjects() const; privat
我是一名优秀的程序员,十分优秀!