gpt4 book ai didi

c++ - 空析构函数导致代码缓慢?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:19:52 40 4
gpt4 key购买 nike

我正在为非 STL 容器类型实现自定义迭代器并遇到以下行为,在这个阶段,这对我来说似乎有点出乎意料。

当您定义一个“空”dtor 时,似乎会对性能产生重大影响?为什么??

为了深入了解这一点,我为 std::vector 实现了一个简单的迭代器,这样我就可以直接与标准 STL 迭代器比较性能。为了公平测试,我简单地从“vector.hpp”复制了一个简化的实现,并尝试添加一个额外的“空”dtor:

template <typename _Myvec> 
class my_slow_iterator // not inheriting from anything!!
{
public :
_Myvec::pointer _ptr; // pointer to vector element

/* All of the standard stuff - essentially from "vector.hpp" */

/* An additional empty dtor */
~my_slow_iterator () {}
};

然后我修改了 std::vector 以便我可以让它返回我的新迭代器类型并使用以下内容进行基准测试 - 对 2000000 个随机整数的 vector 进行排序,在三次运行中取平均值:

std::vector vec;
// fill via rand();
int tt = clock();
std::sort(vec.begin(), vec.end());
tt = clock() - tt; // elapsed time in ms

我获得了以下结果(VS2010、发布版本、_ITERATOR_DEBUG_LEVEL 0 等):

  • 使用标准 STL 迭代器:550 毫秒。
  • 使用删除了空 dtor 的 my_slow_iterator:560 毫秒。
  • 使用包含空 dtor 的 my_slow_iterator:900 毫秒。

在这种情况下,空的 dtor 似乎导致了大约 40% 的减速。

显然,如果 dtor 是空的,那么为什么要有它,但我期望像这样的简单“空”函数会在编译时被内联和优化。如果不是这种情况,那么我想了解发生了什么,以防此类问题在更复杂的情况下产生影响。

编辑:使用 O2 优化编译。

编辑:进一步挖掘,复制构造函数似乎出现了类似的效果。最初(以及在上面的测试中)my_slow_iterator 没有定义复制构造函数,因此使用编译器生成的默认值。

如果我定义以下复制构造器(它所做的不超过我期望编译器生成的复制构造器所做的):

my_slow_iterator (
const my_slow_iterator<_Myvec> &_src
) : _ptr(_src._ptr) {}

对于与上述相同的测试,我看到以下结果:

  • 使用 my_slow_iterator,删除了 dtor,包括了 copy-ctor:690 毫秒
  • 使用 my_slow_iterator,包括 dtor,包括 copy-ctor:980 毫秒

这是进一步(虽然不是那么剧烈)的性能打击。

为什么/为什么编译器默认函数的效率如此之高??用户定义的 ctor/dtor 是否在后台隐式执行某些操作??

最佳答案

我记得在 Linux 上使用 GCC (-O3) 时遇到过类似的情况。用户定义的析构函数的代码尽管是空的并且在头文件中,但还是被发出了,而编译器生成的默认析构函数没有产生任何指令。这让我感到困惑,最终我使代码在没有显式析构函数的情况下工作(尽管以能够在其中添加 assert() 为代价,这就是为什么空的是可取的 - 它在调试版本中不为空)。

关于c++ - 空析构函数导致代码缓慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5891259/

40 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com