gpt4 book ai didi

c++ - (缺少)使用 C++11 move 语义的性能改进

转载 作者:IT老高 更新时间:2023-10-28 21:42:22 25 4
gpt4 key购买 nike

我已经编写 C++11 代码很长一段时间了,还没有对其进行任何基准测试,只期望像 vector 操作这样的东西现在可以通过 move 语义“更快”。因此,当实际使用 GCC 4.7.2 和 clang 3.0(Ubuntu 12.10 64 位的默认编译器)进行基准测试时,我得到了非常不满意的结果。这是我的测试代码:

编辑:关于@DeadMG 和@ronag 发布的(好的)答案,我将元素类型从std::string 更改了。至my::string没有 swap() ,并使所有内部字符串变大(200-700 字节),这样它们就不会成为 SSO 的受害者

EDIT2:原因是奶牛。由伟大的评论再次改编代码,从 std::string 更改存储至std::vector<char>并省略复制/move 构造函数(让编译器生成它们)。如果没有 COW,速度差异实际上是巨大的。

EDIT3:重新添加了使用 -DCOW 编译时的先前解决方案.这使得内部存储成为 std::string而不是 std::vector<char>根据@chico 的要求。

#include <string>
#include <vector>
#include <fstream>
#include <iostream>
#include <algorithm>
#include <functional>

static std::size_t dec = 0;

namespace my { class string
{
public:
string( ) { }
#ifdef COW
string( const std::string& ref ) : str( ref ), val( dec % 2 ? - ++dec : ++dec ) {
#else
string( const std::string& ref ) : val( dec % 2 ? - ++dec : ++dec ) {
str.resize( ref.size( ) );
std::copy( ref.begin( ), ref.end( ), str.begin( ) );
#endif
}

bool operator<( const string& other ) const { return val < other.val; }

private:
#ifdef COW
std::string str;
#else
std::vector< char > str;
#endif
std::size_t val;
}; }


template< typename T >
void dup_vector( T& vec )
{
T v = vec;
for ( typename T::iterator i = v.begin( ); i != v.end( ); ++i )
#ifdef CPP11
vec.push_back( std::move( *i ) );
#else
vec.push_back( *i );
#endif
}

int main( )
{
std::ifstream file;
file.open( "/etc/passwd" );
std::vector< my::string > lines;
while ( ! file.eof( ) )
{
std::string s;
std::getline( file, s );
lines.push_back( s + s + s + s + s + s + s + s + s );
}

while ( lines.size( ) < ( 1000 * 1000 ) )
dup_vector( lines );
std::cout << lines.size( ) << " elements" << std::endl;

std::sort( lines.begin( ), lines.end( ) );

return 0;
}

它的作用是将/etc/passwd 读入一个行 vector ,然后将这个 vector 一遍又一遍地复制到自身上,直到我们至少有 100 万个条目。这是第一个优化应该有用的地方,而不仅仅是显式的std::move()。您在 dup_vector() 中看到,还有push_back当需要调整内部数组的大小(创建新的 + 拷贝)时,本身应该会表现得更好。

最后,对 vector 进行排序。当您不需要每次交换两个元素时都复制临时对象时,这肯定会更快。

我以两种方式编译和运行这两种方式,一种是 C++98,另一种是 C++11(使用 -DCPP11 进行显式 move ):

1> $ rm -f a.out ; g++ --std=c++98 test.cpp ; time ./a.out
2> $ rm -f a.out ; g++ --std=c++11 -DCPP11 test.cpp ; time ./a.out
3> $ rm -f a.out ; clang++ --std=c++98 test.cpp ; time ./a.out
4> $ rm -f a.out ; clang++ --std=c++11 -DCPP11 test.cpp ; time ./a.out

具有以下结果(每次编译两次):

GCC C++98
1> real 0m9.626s
1> real 0m9.709s

GCC C++11
2> real 0m10.163s
2> real 0m10.130s

因此,编译为 C++11 代码时运行会稍微慢一些。 clang 也有类似的结果:

clang C++98
3> real 0m8.906s
3> real 0m8.750s

clang C++11
4> real 0m8.858s
4> real 0m9.053s

谁能告诉我这是为什么?即使在为 C++11 之前的版本进行编译时,编译器是否优化得如此之好,以至于它们实际上达到了 move 语义行为?如果我添加 -O2 ,所有代码运行速度更快,但不同标准之间的结果几乎和上面一样。

编辑:使用 my::string 而不是 std::string 的新结果,以及更大的单个字符串:

$ rm -f a.out ; g++ --std=c++98 test.cpp ; time ./a.out
real 0m16.637s
$ rm -f a.out ; g++ --std=c++11 -DCPP11 test.cpp ; time ./a.out
real 0m17.169s
$ rm -f a.out ; clang++ --std=c++98 test.cpp ; time ./a.out
real 0m16.222s
$ rm -f a.out ; clang++ --std=c++11 -DCPP11 test.cpp ; time ./a.out
real 0m15.652s

C++98 和 C+11 之间在 move 语义方面存在非常小差异。使用 GCC 的 C++11 稍慢,使用 clang 稍快,但差异仍然很小。

EDIT2: 现在没有 std::string的COW,性能提升巨大:

$ rm -f a.out ; g++ --std=c++98 test.cpp ; time ./a.out
real 0m10.313s
$ rm -f a.out ; g++ --std=c++11 -DCPP11 test.cpp ; time ./a.out
real 0m5.267s
$ rm -f a.out ; clang++ --std=c++98 test.cpp ; time ./a.out
real 0m10.218s
$ rm -f a.out ; clang++ --std=c++11 -DCPP11 test.cpp ; time ./a.out
real 0m3.376s

通过优化,差异也大了很多:

$ rm -f a.out ; g++ -O2 --std=c++98 test.cpp ; time ./a.out
real 0m5.243s
$ rm -f a.out ; g++ -O2 --std=c++11 -DCPP11 test.cpp ; time ./a.out
real 0m0.803s
$ rm -f a.out ; clang++ -O2 --std=c++98 test.cpp ; time ./a.out
real 0m5.248s
$ rm -f a.out ; clang++ -O2 --std=c++11 -DCPP11 test.cpp ; time ./a.out
real 0m0.785s

以上显示 C++11 的速度提高了约 6-7 倍。

感谢您的精彩评论和回答。我希望这篇文章对其他人也有用和有趣。

最佳答案

This should definitely be faster when you don't need to copy temporary objects each time two elements are swapped.

std::string 有一个 swap 成员,所以 sort 已经使用它,并且它的内部实现已经是 move 语义,有效。只要涉及 SSO,您就不会看到 std::string 的复制和 move 之间的区别。此外,某些版本的 GCC 仍然有一个非 C++11 允许的基于 COW 的实现,复制和 move 之间也没有太大区别。

关于c++ - (缺少)使用 C++11 move 语义的性能改进,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14293151/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com