- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
给出以下宠物片段:
template<class T1, class T2>
struct my_pair { /* constructors and such */ };
auto f(std::pair<T1, T2> const& p) // (1)
{ return my_pair<T1, T2>(p.first, p.second); }
auto f(std::pair<T1, T2> p) // (2)
{ return my_pair<T1, T2>(p.first, p.second); }
T1
和
T2
都是轻量级对象,它们的复制时间可以忽略不计(例如,每个指针有两个指针),那么将
std::pair
作为副本传递比作为引用传递更好吗?因为我知道有时候让编译器省略副本比强制它处理引用(例如,优化复制链)更好。
my_pair
的构造函数,如果让它们接收副本比引用更好的话。
最佳答案
在微优化 Realm 之外,我通常会传递const
引用,因为您没有修改对象,并且希望避免复制。如果有一天您确实使用了构造成本很高的T1
或T2
,则该副本可能是一个大问题:传递const引用并没有同样强大的步枪。因此,我将按值传递作为具有非对称权衡的选择,并且仅在知道数据很小时才按值选择。
至于您的特定微优化问题,它基本上取决于调用是否完全内联以及您的编译器是否正确。
全内联
如果f
函数的任一变体内联到调用程序中,并且启用了优化,则对于任何一个变体,您都可能获得相同或几乎相同的代码。我用inline_f_ref
和inline_r_val
调用测试here。它们都从未知的外部函数生成pair
,然后调用f
的按引用或变量。
对于f_val
来说是这样的(f_ref
版本仅在结尾更改 call ):
template <typename T>
auto inline_f_val() {
auto pair = get_pair<T>();
return f_val(pair);
}
T1
和
T2
为
int
时在gcc上的结果:
auto inline_f_ref<int>():
sub rsp, 8
call std::pair<int, int> get_pair<int>()
add rsp, 8
ret
auto inline_f_val<int>():
sub rsp, 8
call std::pair<int, int> get_pair<int>()
add rsp, 8
ret
std::pair
和
mypair
实际上具有相同的布局,因此所有
f
的痕迹都会消失。
T1
和
T2
是带有两个指针的结构的版本:
auto inline_f_ref<twop>():
push r12
mov r12, rdi
sub rsp, 32
mov rdi, rsp
call std::pair<twop, twop> get_pair<twop>()
mov rax, QWORD PTR [rsp]
mov QWORD PTR [r12], rax
mov rax, QWORD PTR [rsp+8]
mov QWORD PTR [r12+8], rax
mov rax, QWORD PTR [rsp+16]
mov QWORD PTR [r12+16], rax
mov rax, QWORD PTR [rsp+24]
mov QWORD PTR [r12+24], rax
add rsp, 32
mov rax, r12
pop r12
ret
std::pair
内容复制到
mypair
对象(有4个存储区,总共存储32个字节,即4个指针)。因此,再次内联让编译器针对相同的事物优化版本。
-O2
关键字的情况下,它没有在
inline
中内联非常短的函数)。
const
引用版本相当于传递一个指针,因此无论
T1
和
T2
如何,您都将向第一个整数寄存器中的
std::pair
对象传递一个指针。
T1
和
T2
是
int
时导致的代码:
auto f_ref<int, int>(std::pair<int, int> const&):
mov rax, QWORD PTR [rdi]
ret
std::pair
指针在
rdi
中传递,因此函数的主体是从该位置到
rax
的单个8字节移动。
std::pair<int, int>
占用8个字节,因此编译器可以一枪复制整个内容。在这种情况下,返回值在
rax
中“按值”传递,因此我们完成了。
my_pair<int,int> f_ref<int,int>(std::pair<int,int> const &) PROC ; f_ref<int,int>, COMDAT
mov eax, DWORD PTR [rdx]
mov r8d, DWORD PTR [rdx+4]
mov DWORD PTR [rcx], eax
mov rax, rcx
mov DWORD PTR [rcx+4], r8d
ret 0
mypair<int,int>
中返回
rax
。而是,调用者在
rcx
中传递一个指向被调用者应保存结果的位置的指针。因此,此功能除负载外还具有存储功能。
rax
加载了保存数据的位置。第二件事是,编译器太笨拙,无法将两个相邻的4字节加载组合在一起并存储为8字节加载,因此有两个加载和两个存储。
auto f_val<int, int>(std::pair<int, int>):
mov rax, rdi
ret
my_pair<int,int> f_val<int,int>(std::pair<int,int>)
mov rax, rdx
mov DWORD PTR [rcx], edx
shr rax, 32 ; 00000020H
mov DWORD PTR [rcx+4], eax
mov rax, rcx
ret 0
std::pair
中的
rax
的64位开始,它写出底部的32位,将顶部的32位移至底部,然后将其写出。世界上最慢的仅写出64位的方式。不过,此代码通常将比按引用版本要快。
f
和
T1
为
T2
时
twop
的副引用版本-包含两个指针的结构,Linux gcc:
auto f_ref<twop, twop>(std::pair<twop, twop> const&):
mov rax, rdi
mov r8, QWORD PTR [rsi]
mov rdi, QWORD PTR [rsi+8]
mov rcx, QWORD PTR [rsi+16]
mov rdx, QWORD PTR [rsi+24]
mov QWORD PTR [rax], r8
mov QWORD PTR [rax+8], rdi
mov QWORD PTR [rax+16], rcx
mov QWORD PTR [rax+24], rdx
auto f_val<twop, twop>(std::pair<twop, twop>):
mov rdx, QWORD PTR [rsp+8]
mov rax, rdi
mov QWORD PTR [rdi], rdx
mov rdx, QWORD PTR [rsp+16]
mov QWORD PTR [rdi+8], rdx
mov rdx, QWORD PTR [rsp+24]
mov QWORD PTR [rdi+16], rdx
mov rdx, QWORD PTR [rsp+32]
mov QWORD PTR [rdi+24], rdx
[rsp]
复制),在按引用的情况下,对象由第一个参数指向,因此我们从
[rdi
] 1复制。
rdi
接受第一个参数,而不是
rsi
-但是这里发生的是返回值也必须通过内存传递,因此有一个隐藏的第一个参数-指向返回值的目标缓冲区的指针-被隐式使用,并进入
rdi
。
关于c++ - 作为 `const&`轻量级对象传递,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57349068/
标记为家庭作业,因为这是我写的期中问题,但我不明白答案。我被要求在以下语句中解释每个 const 的用途: const char const * const GetName() const { ret
const int* const fun(const int* const& p) const; 我试图弄清楚这个给定函数原型(prototype)的输入参数。我在这两个之间争论,不确定哪个是正确的。
下面的代码用于在同时存在 const 和非 const getter 时减少代码重复。它从非 const 创建 const 版本。我搜索了一下,很多人说我应该从 const 创建非 const 版本。
据我所知,TypeScript 查看了 const string变量作为一个不可变的类型变量,只有那个值,没有其他可能的值。一直以为加as const那是多余的。 为什么我在示例的第二部分得到以下内容
我有一个具有以下签名的方法: size_t advanceToNextRuleEntryRelatedIndex( size_t index, size_t nStrings, char const
首先,有什么区别: (1) const char* (2) char const* (3) const char const* 我相当确定我完全理解这一点,但我希望有人能具体地给我一个句子,这样它就会
这里是新手! 我正在阅读一段代码,我看到作者经常写一个成员函数作为 const int func (const scalar& a) const // etc 你看这里有三个const,现在我明白了中
我总是搞乱如何正确使用 const int*、const int * const 和 int const *。是否有一套规则来定义你可以做什么和不能做什么? 我想知道在赋值、传递给函数等方面所有该做和
我见过人们将 const 用作函数参数的代码。使用 const* 与 const * const 有什么好处?这可能是一个非常基本的问题,但如果有人能解释一下,我将不胜感激。 Bool IsThisN
我总是搞乱如何正确使用 const int*、const int * const 和 int const *。是否有一套规则来定义你可以做什么和不能做什么? 我想知道在赋值、传递给函数等方面所有该做和
这个问题在这里已经有了答案: What is the difference between const int*, const int * const, and int const *? (23 个
如果引用的对象不是 const 对象,那么引用“const”关键字的目的是什么? r1 和 r2 的作用(如下)有什么不同吗? int i = 42; // non const object cons
friend 让我解释原因 const const const const const int const i = 0; 是有效的语法。我拒绝对这个话题有任何想法。虽然我很好奇它是否只是语法问题? 编
我总是搞砸如何正确使用 const int*、const int * const 和 int const *。是否有一套规则来定义你能做什么和不能做什么? 我想知道在分配、传递给函数等方面的所有注意事
常量在 const char* push(const char * const &&_data); 表示无法更改引用的内容。为什么我不能将 const char* 传递给 push? 最佳答案 您的代
我有一个关于在函数参数中涉及指针的最佳实践以及它们是否应该指定为 *const 的问题或 const *const .我知道对于 const 的使用或过度使用存在不同的意见。 ,但至少有一些用途是捕捉
我目前正在为我的类(class)写一个作业,它应该充当一个非常基本的外壳。我快完成了,但是我遇到了 execvp 和我的参数字符数组的问题。这是我的代码的一小段。 //Split the left c
所以,我知道了char const *、char * const 和char const * const 之间的区别。那些是: char* the_string : I can change the
我正在运行一些示例程序以重新熟悉 C++,我遇到了以下问题。首先,这里是示例代码: void print_string(const char * the_string) { cout << t
我正在为系统中的编译错误而苦苦挣扎,这是代码 struct Strless : public binary_function { public : bool operator()(cons
我是一名优秀的程序员,十分优秀!