c++ - 了解 C++11 中 lambda 函数的开销-6ren

c++ - 了解 C++11 中 lambda 函数的开销

转载作者：IT老高更新时间：2023-10-28 23:27:47

26

4

这已经在 Why C++ lambda is slower than ordinary function when called multiple times? 中被提及和 C++0x Lambda overhead但我认为我的例子与前者的讨论有些不同，与后者的结果相矛盾。

在我的代码中搜索瓶颈时，我发现了一个递归模板函数，它使用给定的处理器函数处理可变参数列表，例如将值复制到缓冲区中。

template <typename T>
void ProcessArguments(std::function<void(const T &)> process)
{}

template <typename T, typename HEAD, typename ... TAIL>
void ProcessArguments(std::function<void(const T &)> process, const HEAD &head, const TAIL &... tail)
{
  process(head);
  ProcessArguments(process, tail...);
}

我将使用此代码的程序的运行时间与 lambda 函数以及使用移动指针将参数复制到全局缓冲区的全局函数进行了比较:

int buffer[10];
int main(int argc, char **argv)
{
  int *p = buffer;

  for (unsigned long int i = 0; i < 10E6; ++i)
  {
    p = buffer;
    ProcessArguments<int>([&p](const int &v) { *p++ = v; }, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
  }
}

用 g++ 4.6 和 -O3 编译，用工具测量时间在我的机器上需要超过 6 秒，而

int buffer[10];
int *p = buffer;
void CopyIntoBuffer(const int &value)
{
  *p++ = value;
}

int main(int argc, char **argv)
{
  int *p = buffer;

  for (unsigned long int i = 0; i < 10E6; ++i)
  {
    p = buffer;
    ProcessArguments<int>(CopyIntoBuffer, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
  }

  return 0;
}

大约需要 1.4 秒。

我不明白幕后发生的事情解释了时间开销，我想知道是否可以更改某些内容以使用 lambda 函数而无需支付运行时费用。

最佳答案

这里的问题是你对 std::function 的使用。您通过复制发送它，因此复制其内容(并在展开参数时递归地执行此操作)。

现在，对于指向函数的指针，内容就是指向函数的指针。对于 lambda，内容至少是指向您捕获的函数 + 引用的指针。这是复制的两倍。另外，由于 std::function 的类型删除，复制任何数据很可能会更慢(不是内联)。

这里有几个选项，最好的可能不是传递 std::function，而是传递模板。好处是您的方法调用更有可能被内联，std::function 不会发生类型删除，不会发生复制，一切都非常好。像这样:

template <typename TFunc>
void ProcessArguments(const TFunc& process)
{}

template <typename TFunc, typename HEAD, typename ... TAIL>
void ProcessArguments(const TFunc& process, const HEAD &head, const TAIL &... tail)
{
  process(head);
  ProcessArguments(process, tail...);
}

第二个选项做同样的事情，但是通过复制发送 process。现在，复制确实发生了，但仍然整齐地内联。

同样重要的是 process 的主体也可以内联，尤其是对于 lamda。根据复制 lambda 对象的复杂性及其大小，通过拷贝传递可能会也可能不会比通过引用传递更快。它可能会更快，因为编译器可能比本地拷贝更难推理引用。

template <typename TFunc>
void ProcessArguments(TFunc process)
{}

template <typename TFunc, typename HEAD, typename ... TAIL>
void ProcessArguments(TFunc process, const HEAD &head, const TAIL &... tail)
{
  process(head);
  ProcessArguments(process, tail...);
}

第三个选项是，好吧，尝试通过引用传递 std::function<> 。这样您至少可以避免复制，但不会内联调用。

以下是一些性能结果(使用 ideones 的 C++11 编译器)。请注意，正如预期的那样，内联 lambda 主体为您提供了最佳性能:

Original function:
0.483035s

Original lambda:
1.94531s


Function via template copy:
0.094748

### Lambda via template copy:
0.0264867s


Function via template reference:
0.0892594s

### Lambda via template reference:
0.0264201s


Function via std::function reference:
0.0891776s

Lambda via std::function reference:
0.09s

关于c++ - 了解 C++11 中 lambda 函数的开销，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18619035/

26

4

0

文章推荐： android - 撤销权限 android.permission.CAMERA

文章推荐： Android SQLite 泄露

文章推荐：安卓强制关闭: ClassNotFoundException for Activity class

文章推荐： android - RecyclerView stackFromBottom

lambda - 如何返回接收 lambda/函数的匿名函数/lambda？
可以使用 lambda 和函数创建有序对(Lisp 中的缺点)，如 Use of lambda for cons/car/cdr definition in SICP 所示。它也适用于 Python
aws-lambda - Lambda 链接 - 使用 terraform 从另一个 lambda 调用 lambda
我正在尝试从另一个调用一个 AWS lambda 并执行 lambda 链接。这样做的理由是 AWS 不提供来自同一个 S3 存储桶的多个触发器。我创建了一个带有 s3 触发器的 lambda。第一
lambda - Kotlin 扩展 lambda 与常规 lambda
根据以下源代码，常规 lambda 似乎可以与扩展 lambda 互换。 fun main(args: Array) { val numbers = listOf(1, 2, 3) f
lambda - lambda 乘法如何工作？
A Tutorial Introduction to the Lambda Calculus 本文介绍乘法函数 The multiplication of two numbers x and y ca
lambda - lambda 演算的语法树
我想弄清楚如何为下面的表达式绘制语法树。首先，这究竟是如何表现的？看样子是以1和2为参数，如果n是 0，它只会返回 m . 另外，有人可以指出解析树的开始，还是一个例子？我一直找不到一个。最佳答案
lambda - lambda 函数的类型是什么？
在 C++0x 中，我想知道 lambda 函数的类型是什么。具体来说: #include type1 foo(int x){ return [x](int y)->int{return x * y
lambda - lambda 是一种高阶函数吗？
我在其中一个职位发布中看到了这个问题，它询问什么是 lambda 函数以及它与高阶函数的关系。我已经知道如何使用 lambda 函数，但不太自信地解释它，所以我做了一点谷歌搜索，发现了这个:What
lambda - lambda 表达式的名字是如何得来的？
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
lambda - 在方案中嵌套 Lambda？
Evaluate (((lambda(x y) (lambda (x) (* x y))) 5 6) 10) in Scheme. 我不知道实际上该怎么做! ((lambda (x y) (+ x x
lambda - 如何检查参数是否为 lambda
我正在处理 MyCustomType 的实例集合如下: fun runAll(vararg commands: MyCustomType){ commands.forEach { it.myM
lambda - 冯诺依曼机器和 Lambdas
Brian 在他对问题 "Are side effects a good thing?" 的论证中的前提很有趣: computers are von-Neumann machines that are
lambda - 在Scheme中让-over-lambda？
在 Common Lisp 中，如果我希望两个函数共享状态，我将按如下方式执行 let over lambda: (let ((state 1)) (defun inc-state () (in
lambda - 在方案中嵌套 Lambda？
Evaluate (((lambda(x y) (lambda (x) (* x y))) 5 6) 10) in Scheme. 我不知道实际上该怎么做! ((lambda (x y) (+ x x
lambda - lambda 演算中的算术定义
作为lambda calculus wiki说: There are several possible ways to define the natural numbers in lambda cal
lambda - lambda 表达式的函数
我有一个数据类，我需要初始化一些 List .我需要获取 JsonArray 的值(我使用的是 Gson)。我做了这个函数: private fun arrayToList(data: JsonAr
lambda - ((lambda () )) 的简写
((lambda () )) 的方案中是否有简写例如，代替 ((lambda () (define x 1) (display x))) 我希望能够做类似的事情 (empty-lam
lambda - 比较器作为 lambda
我在 Java library 中有以下方法: public void setColumnComparator(final int columnIndex, final Comparator colu
lambda - lambda 内部的非法函数调用
我正在研究一个函数来计算国际象棋游戏中棋子的有效移动。 white-pawn-move 函数有效。当我试图将其概括为任一玩家的棋子 (pawn-move) 时，我遇到了非法函数调用。我已经在 repl
c++ - 模板化 lambda 中的所有 lambda 是否也是模板化 lambda？
考虑这段代码(在 GCC 和 MSVC 上编译): int main() { auto foo = [](auto p){ typedef decltype(p) p_t;
Python:在 lambda 中使用 lambda 返回 lambda 对象
我正在阅读一个在 lambda 内部使用 lambda 的片段，然后我想通过创建一个虚拟函数来测试它，该函数从文件中读取然后返回最大和最小数字。这是我想出来的 dummy = lambda path

首页

博学

6Ren·AI

商城

c++ - 了解 C++11 中 lambda 函数的开销