- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
编辑:我又添加了两个基准测试,以比较 realloc 与 C 数组的使用以及 reserve() 与 std::vector 的使用。从最后的分析来看,realloc 的影响似乎很大,即使只调用了 30 次。检查文档我猜这是因为 realloc 可以返回一个全新的指针,复制旧指针。为了完成这个场景,我还添加了用于在初始化期间完全分配数组的代码和图表。与 reserve()
的区别是显而易见的。
编译标志:仅图中描述的优化,使用 g++ 编译,仅此而已。
原始问题:
我对 std::vector
与新建/删除数组进行了基准测试,当我添加 10 亿个整数时,第二个代码比使用 vector 的代码快得多,尤其是在优化的情况下开启。
我怀疑这是vector内部调用realloc次数太多造成的。如果 vector 每次填充时都不会增长一倍,就会出现这种情况(这里数字 2 没有什么特别的,重要的是它的大小呈几何增长)。在这种情况下,对 realloc 的调用将仅为 O(log n)
而不是 O(n)
。
如果这就是导致第一个代码运行缓慢的原因,我该如何告诉 std::vector 以几何方式增长?
请注意,调用 reserve once 在这种情况下会起作用,但在更一般的情况下不起作用,在这种情况下 push_back 的数量是事先不知道的。
黑线
#include<vector>
int main(int argc, char * argv[]) {
const unsigned long long size = 1000000000;
std::vector <int> b(size);
for(int i = 0; i < size; i++) {
b[i]=i;
}
return 0;
}
蓝线
#include<vector>
int main(int argc, char * argv[]) {
const int size = 1000000000;
std::vector <int> b;
for(int i = 0; i < size; i++) {
b.push_back(i);
}
return 0;
}
绿线
#include<vector>
int main(int argc, char * argv[]) {
const int size = 1000000000;
std::vector <int> b;
b.reserve(size);
for(int i = 0; i < size; i++) {
b.push_back(i);
}
return 0;
}
红线
int main(int argc, char * argv[]) {
const int size = 1000000000;
int * a = new int [size];
for(int i = 0; i < size; i++) {
a[i] = i;
}
delete [] a;
return 0;
}
橙线
#include<vector>
int main(int argc, char * argv[]) {
const unsigned long long size = 1000000000;
int * a = (int *)malloc(size*sizeof(int));
int next_power = 1;
for(int i = 0; i < size; i++) {
a[i] = i;
if(i == next_power - 1) {
next_power *= 2;
a=(int*)realloc(a,next_power*sizeof(int));
}
}
free(a);
return 0;
}
编辑:按照建议检查.capacity()
,我们看到增长确实呈指数级增长。那么为什么 vector 这么慢?
最佳答案
优化后的 C 样式数组优化为空。
xorl %eax, %eax
retq
这就是程序。
每当你有一个优化到接近 0 的程序时,你应该考虑这种可能性。
优化器发现您没有对分配的内存执行任何操作,注意到未使用的分配内存可能具有零副作用,并消除了分配。
并且写入内存然后从不读取它也具有零副作用。
相比之下,编译器很难证明 vector 的分配是无用的。编译器开发人员可能会教它识别未使用的 std vector ,就像他们识别未使用的原始 C 数组一样,但这种优化确实是一个极端情况,根据我的经验,它会导致很多问题分析。
请注意,在任何优化级别的 vector-with-reserve 与未优化的 C 样式版本的速度基本相同。
在 C 风格的代码中,唯一需要优化的是“什么都不做”。在 vector 代码中,未优化的版本充满了额外的堆栈帧和调试检查,以确保您不会越界(如果越界,则彻底崩溃)。
请注意,在 Linux 系统上,分配大块内存除了摆弄虚拟内存表外没有任何作用。只有当内存被触摸时,它才会真正为您找到一些零的物理内存。
毫无保留地,std vector 必须猜测一个初始的小尺寸,调整它的大小并复制它,然后重复。这会导致 50% 的性能损失,这对我来说似乎是合理的。
有了保留,它实际上就完成了工作。这项工作只需不到 5 秒。
通过推回添加到 vector 确实会导致它呈几何增长。几何增长导致每份数据的 2-3 个拷贝的渐近平均。
至于重新分配,std::vector 不重新分配。它分配一个新缓冲区,并复制旧数据,然后丢弃旧数据。
Realoc 尝试增大缓冲区,如果不能,则按位复制缓冲区。
这比 std vector 管理按位可复制类型的效率更高。我敢打赌 realloc 版本实际上从不复制;总是有内存空间可以将 vector 增长到(在实际程序中可能不是这种情况)。
std 库分配器中缺少 realloc 是一个小缺陷。您必须为它发明一个新的 API,因为您希望它适用于非按位复制(类似于“尝试增加分配的内存”,如果失败则由您决定增加分配)。
关于c++ - std::vector 的性能差是因为没有调用 realloc 的对数次数吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49615076/
我正在开发一个小型图书馆,我需要做的一件事是让访问者访问一些数据并返回结果。 在一些较旧的 C++ 代码中,访问者需要声明一个 typedef return_type .例如,boost::stati
我正在尝试使用std:map类型的键和值制作std::any Visual Studio 2017 std::map m("lastname", "Ivanov"); std::cout (m["la
我已经在 C++ 的 map 中声明了一个集合为 std::map> .如何循环访问或打印设定值? 最佳答案 如果你知道如何迭代 std::map或 std::set单独地,您应该可以毫无问题地组合迭
如何循环? 我已经试过了: //----- code std::vector >::iterator it; for ( it = users.begin(); it != users.end();
我有两个用例。 A.我想同步访问两个线程的队列。 B.我想同步两个线程对队列的访问并使用条件变量,因为其中一个线程将等待另一个线程将内容存储到队列中。 对于用例 A,我看到了使用 std::lock_
我正在查看这两种类型特征的文档,但不确定有什么区别。我不是语言律师,但据我所知,它们都适用于“memcpy-able”类型。 它们可以互换使用吗? 最佳答案 不,这些术语不能互换使用。这两个术语都表示
我有以下测试代码,其中有一个参数 fS,它是 ofstream 的容器: #include #include #include #include int
这是这个问题的延续 c++ function ptr in unorderer_map, compile time error 我试图使用 std::function 而不是函数指针,并且只有当函数是
std::unordered_map str_bool_map = { {"a", true}, {"b", false}, {"c", true} }; 我们可以在此映射上使
我有以下对象 std::vector> vectorList; 然后我添加到这个使用 std::vector vec_tmp; vec_tmp.push_back(strDRG); vec_tmp.p
为什么 std::initializer_list不支持std::get<> , std::tuple_size和 std::tuple_element ?在constexpr中用得很多现在的表达式,
我有一个像这样定义的变量 auto drum = std::make_tuple ( std::make_tuple ( 0.3f , Ex
假设我有一个私有(private)std::map在我的类(class)里std::map 。我怎样才能将其转换为std::map返回给用户?我想要下面的原型(prototype) const std
假设我有一个私有(private)std::map在我的类(class)里std::map 。我怎样才能将其转换为std::map返回给用户?我想要下面的原型(prototype) const std
问题 我正在尝试将 lambda 闭包传递给 std::thread,它使用任意封闭参数调用任意封闭函数。 template std::thread timed_thread(Function&& f
我想创建一个模板类,可以容纳容器和容器的任意组合。例如,std::vector或 std::map ,例如。 我尝试了很多组合,但我必须承认模板的复杂性让我不知所措。我编译的关闭是这样的: templ
我有一个 std::vector>我将其分配给相同类型的第二个 vector 。 我收到这个编译器错误: /opt/gcc-8.2.0/include/c++/8.2.0/bits/stl_algob
有时候,我们有一个工厂可以生成一个 std::unique_ptr vector ,后来我们想在类/线程/你命名的之间共享这些指针。因此,最好改用 std::shared_ptr 。当然有一种方法可以
这个问题在这里已经有了答案: Sorting a vector of custom objects (14 个答案) 关闭 6 年前。 我创建了一个 vector vector ,我想根据我定义的参
我有三个类(class)成员: public: std::vector > getObjects(); std::vector > getObjects() const; privat
我是一名优秀的程序员,十分优秀!