c++ - 为什么将函数包装到 lambda 中可能会使程序更快？-6ren

c++ - 为什么将函数包装到 lambda 中可能会使程序更快？

转载作者：太空狗更新时间：2023-10-29 20:49:40

24

4

标题可能过于笼统。我正在对大型 vector<unsigned> v 上的以下 2 个语句进行基准测试:

sort(v.begin(), v.end(), l);

sort(v.begin(), v.end(), [](unsigned a, unsigned b) { return l(a, b); });

哪里l定义为

bool l(unsigned a, unsigned b) { return a < b; }

结果让我大吃一惊:第二个和sort(v.begin(), v.end());一样快或 sort(v.begin(), v.end(), std::less<>());而第一个明显较慢。

我的问题是为什么将函数包装在 lambda 中可以加快程序速度。

此外，sort(v.begin(), v.end(), [](unsigned a, unsigned b) { return l(b, a); });也一样快。

相关代码:

#include <iostream>
#include <vector>
#include <chrono>
#include <random>
#include <functional>
#include <algorithm>

using std::cout;
using std::endl;
using std::vector;

bool l(unsigned a, unsigned b) { return a < b; };

int main(int argc, char** argv)
{
    auto random = std::default_random_engine();
    vector<unsigned> d;
    for (unsigned i = 0; i < 100000000; ++i)
        d.push_back(random());
    auto t0 = std::chrono::high_resolution_clock::now();
    std::sort(d.begin(), d.end());
    auto t1 = std::chrono::high_resolution_clock::now();
    cout << std::chrono::duration_cast<std::chrono::nanoseconds>(t1 - t0).count() << endl;


    d.clear();
    for (unsigned i = 0; i < 100000000; ++i)
        d.push_back(random());
    t0 = std::chrono::high_resolution_clock::now();
    std::sort(d.begin(), d.end(), l);
    t1 = std::chrono::high_resolution_clock::now();
    cout << std::chrono::duration_cast<std::chrono::nanoseconds>(t1 - t0).count() << endl;

    d.clear();
    for (unsigned i = 0; i < 100000000; ++i)
        d.push_back(random());
    t0 = std::chrono::high_resolution_clock::now();
    std::sort(d.begin(), d.end(), [](unsigned a, unsigned b) {return l(a, b); });
    t1 = std::chrono::high_resolution_clock::now();
    cout << std::chrono::duration_cast<std::chrono::nanoseconds>(t1 - t0).count() << endl;
    return 0;
}

在 g++ 和 MSVC 上测试。

更新:

我发现 lambda 版本生成的汇编代码与默认版本 ( sort(v.begin(), v.end()) ) 完全相同，而使用函数的版本则不同。但我不会汇编，因此无法做更多。

最佳答案

sort可能是一个很大的功能，所以它通常不是内联的。因此单独编译。考虑 sort :

template <typename RanIt, typename Pred>
void sort(RanIt, RanIt, Pred)
{
}

如果Pred是bool (*)(unsigned, unsigned) ，没有办法内联函数——函数指针类型不能唯一标识一个函数。只有一个 sort<It, It, bool (*)(unsigned, unsigned)> , 它被所有具有不同函数指针的调用所调用。用户通过 l到函数，但这只是作为一个普通参数处理。因此无法内联调用。

如果Pred是一个 lambda，内联函数调用是微不足道的——lambda 类型唯一标识一个函数。每次调用 sort 的实例化调用相同的 (lambda) 函数，所以我们没有函数指针的问题。 lambda 本身包含对 l 的直接调用，这也很容易内联。因此，编译器内联所有函数调用并生成与无谓词相同的代码 sort .

函数闭包类型 ( std::less<> ) 的情况类似:调用 std::less<> 的行为编译时完全知道sort , 所以内联是微不足道的。

关于c++ - 为什么将函数包装到 lambda 中可能会使程序更快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57830971/

24

4

0

文章推荐： python - Pandas groupby : percentage above threshold

文章推荐： c# - 为什么 params 关键字不是上下文相关的？

文章推荐： python - PyQt QDialog - 返回一个值并从对话框中关闭

文章推荐： c# - 使用更好吗？

lambda - 如何返回接收 lambda/函数的匿名函数/lambda？
可以使用 lambda 和函数创建有序对(Lisp 中的缺点)，如 Use of lambda for cons/car/cdr definition in SICP 所示。它也适用于 Python
aws-lambda - Lambda 链接 - 使用 terraform 从另一个 lambda 调用 lambda
我正在尝试从另一个调用一个 AWS lambda 并执行 lambda 链接。这样做的理由是 AWS 不提供来自同一个 S3 存储桶的多个触发器。我创建了一个带有 s3 触发器的 lambda。第一
lambda - Kotlin 扩展 lambda 与常规 lambda
根据以下源代码，常规 lambda 似乎可以与扩展 lambda 互换。 fun main(args: Array) { val numbers = listOf(1, 2, 3) f
lambda - lambda 乘法如何工作？
A Tutorial Introduction to the Lambda Calculus 本文介绍乘法函数 The multiplication of two numbers x and y ca
lambda - lambda 演算的语法树
我想弄清楚如何为下面的表达式绘制语法树。首先，这究竟是如何表现的？看样子是以1和2为参数，如果n是 0，它只会返回 m . 另外，有人可以指出解析树的开始，还是一个例子？我一直找不到一个。最佳答案
lambda - lambda 函数的类型是什么？
在 C++0x 中，我想知道 lambda 函数的类型是什么。具体来说: #include type1 foo(int x){ return [x](int y)->int{return x * y
lambda - lambda 是一种高阶函数吗？
我在其中一个职位发布中看到了这个问题，它询问什么是 lambda 函数以及它与高阶函数的关系。我已经知道如何使用 lambda 函数，但不太自信地解释它，所以我做了一点谷歌搜索，发现了这个:What
lambda - lambda 表达式的名字是如何得来的？
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
lambda - 在方案中嵌套 Lambda？
Evaluate (((lambda(x y) (lambda (x) (* x y))) 5 6) 10) in Scheme. 我不知道实际上该怎么做! ((lambda (x y) (+ x x
lambda - 如何检查参数是否为 lambda
我正在处理 MyCustomType 的实例集合如下: fun runAll(vararg commands: MyCustomType){ commands.forEach { it.myM
lambda - 冯诺依曼机器和 Lambdas
Brian 在他对问题 "Are side effects a good thing?" 的论证中的前提很有趣: computers are von-Neumann machines that are
lambda - 在Scheme中让-over-lambda？
在 Common Lisp 中，如果我希望两个函数共享状态，我将按如下方式执行 let over lambda: (let ((state 1)) (defun inc-state () (in
lambda - 在方案中嵌套 Lambda？
Evaluate (((lambda(x y) (lambda (x) (* x y))) 5 6) 10) in Scheme. 我不知道实际上该怎么做! ((lambda (x y) (+ x x
lambda - lambda 演算中的算术定义
作为lambda calculus wiki说: There are several possible ways to define the natural numbers in lambda cal
lambda - lambda 表达式的函数
我有一个数据类，我需要初始化一些 List .我需要获取 JsonArray 的值(我使用的是 Gson)。我做了这个函数: private fun arrayToList(data: JsonAr
lambda - ((lambda () )) 的简写
((lambda () )) 的方案中是否有简写例如，代替 ((lambda () (define x 1) (display x))) 我希望能够做类似的事情 (empty-lam
lambda - 比较器作为 lambda
我在 Java library 中有以下方法: public void setColumnComparator(final int columnIndex, final Comparator colu
lambda - lambda 内部的非法函数调用
我正在研究一个函数来计算国际象棋游戏中棋子的有效移动。 white-pawn-move 函数有效。当我试图将其概括为任一玩家的棋子 (pawn-move) 时，我遇到了非法函数调用。我已经在 repl
c++ - 模板化 lambda 中的所有 lambda 是否也是模板化 lambda？
考虑这段代码(在 GCC 和 MSVC 上编译): int main() { auto foo = [](auto p){ typedef decltype(p) p_t;
Python:在 lambda 中使用 lambda 返回 lambda 对象
我正在阅读一个在 lambda 内部使用 lambda 的片段，然后我想通过创建一个虚拟函数来测试它，该函数从文件中读取然后返回最大和最小数字。这是我想出来的 dummy = lambda path

首页

博学

6Ren·AI

商城

c++ - 为什么将函数包装到 lambda 中可能会使程序更快？