Java lambda 比匿名类慢 20 倍-6ren

Java lambda 比匿名类慢 20 倍

转载作者：行者123 更新时间：2023-12-02 00:45:53

24

4

我在这里看到了很多关于 Java lambda 性能的问题，但大多数都是这样的:“Lambda 稍快一些，但使用闭包时会变慢”或“预热与执行时间不同”或其他类似的问题事情。

但是，我在这里遇到了一件相当奇怪的事情。考虑this LeetCode problem :

Given a set of non-overlapping intervals, insert a new interval intothe intervals (merge if necessary).

You may assume that the intervals were initially sorted according totheir start times.

这个问题被标记为“硬”，所以我认为线性方法不是他们想要的。因此，我决定想出一种巧妙的方法，将二分搜索与对输入列表的修改结合起来。现在修改输入列表的问题不是很清楚——它说“插入”，尽管签名要求返回对列表的引用，但现在不用介意。这是完整的代码，但只有前几行与这个问题相关。我将其余部分保留在这里，以便任何人都可以尝试:

public List<Interval> insert(List<Interval> intervals, Interval newInterval) {
    int start = Collections.binarySearch(intervals, newInterval,
                                         (i1, i2) -> Integer.compare(i1.start, i2.start));
    int skip = start >= 0 ? start : -start - 1;
    int end = Collections.binarySearch(intervals.subList(skip, intervals.size()),
                                       new Interval(newInterval.end, 0),
                                       (i1, i2) -> Integer.compare(i1.start, i2.start));
    if (end >= 0) {
        end += skip; // back to original indexes
    } else {
        end -= skip; // ditto
    }
    int newStart = newInterval.start;
    int headEnd;
    if (-start - 2 >= 0) {
        Interval prev = intervals.get(-start - 2);
        if (prev.end < newInterval.start) {
            // the new interval doesn't overlap the one before the insertion point
            headEnd = -start - 1;
        } else {
            newStart = prev.start;
            headEnd = -start - 2;
        }
    } else if (start >= 0) {
        // merge the first interval
        headEnd = start;
    } else { // start == -1, insertion point = 0
        headEnd = 0;
    }
    int newEnd = newInterval.end;
    int tailStart;
    if (-end - 2 >= 0) {
        // merge the end with the previous interval
        newEnd = Math.max(newEnd, intervals.get(-end - 2).end);
        tailStart = -end - 1;
    } else if (end >= 0) {
        newEnd = intervals.get(end).end;
        tailStart = end + 1;
    } else { // end == -1, insertion point = 0
        tailStart = 0;
    }
    intervals.subList(headEnd, tailStart).clear();
    intervals.add(headEnd, new Interval(newStart, newEnd));
    return intervals;
}

这个方法运行良好并被接受，但运行时间为 80 毫秒，而大多数解决方案为 4-5 毫秒，有些为 18-19 毫秒。当我查找它们时，它们都是线性的并且非常原始。人们不会期望从标记为“困难”的问题中得到什么。

但问题来了:我的解决方案在最坏情况下也是线性的(因为添加/清除操作是线性时间)。为什么那么慢？然后我这样做了:

Comparator<Interval> comparator = new Comparator<Interval>() {
    @Override
    public int compare(Interval i1, Interval i2) {
        return Integer.compare(i1.start, i2.start);
    }
};
int start = Collections.binarySearch(intervals, newInterval, comparator);
int skip = start >= 0 ? start : -start - 1;
int end = Collections.binarySearch(intervals.subList(skip, intervals.size()),
                                   new Interval(newInterval.end, 0),
                                   comparator);

从 80 毫秒降至 4 毫秒!这里发生了什么？不幸的是，我不知道 LeetCode 运行什么样的测试或在什么环境下运行，但是 20 倍不是太多了吗？

最佳答案

您显然遇到了 lambda 表达式的首次初始化开销。正如评论中已经提到的，lambda 表达式的类是在运行时生成的，而不是从类路径加载的。

但是，生成并不是减速的原因。毕竟，生成具有简单结构的类甚至比从外部源加载相同字节还要快。并且内部类也必须被加载。但是，当应用程序以前没有使用过 lambda 表达式时，甚至必须加载用于生成 lambda 类的框架(Oracle 当前的实现在幕后使用 ASM)。这是十几个内部使用的类的加载和初始化速度减慢的实际原因，而不是 lambda 表达式本身²。

您可以轻松验证这一点。在当前使用 lambda 表达式的代码中，有两个相同的表达式 (i1, i2) -> Integer.compare(i1.start, i2.start)。当前的实现无法识别这一点(实际上，编译器也不提供提示)。因此，这里生成了两个具有不同类的 lambda 实例。您可以重构代码，使其只有一个比较器，类似于您的内部类变体:

final Comparator<? super Interval> comparator
  = (i1, i2) -> Integer.compare(i1.start, i2.start);
int start = Collections.binarySearch(intervals, newInterval, comparator);
int skip = start >= 0 ? start : -start - 1;
int end = Collections.binarySearch(intervals.subList(skip, intervals.size()),
                                   new Interval(newInterval.end, 0),
                                   comparator);

您不会注意到任何显着的性能差异，因为重要的不是 lambda 表达式的数量，而是框架的类加载和初始化，这只会发生一次。

您甚至可以通过插入额外的 lambda 表达式来最大化它，例如

final Comparator<? super Interval> comparator1
    = (i1, i2) -> Integer.compare(i1.start, i2.start);
final Comparator<? super Interval> comparator2
    = (i1, i2) -> Integer.compare(i1.start, i2.start);
final Comparator<? super Interval> comparator3
    = (i1, i2) -> Integer.compare(i1.start, i2.start);
final Comparator<? super Interval> comparator4
    = (i1, i2) -> Integer.compare(i1.start, i2.start);
final Comparator<? super Interval> comparator5
    = (i1, i2) -> Integer.compare(i1.start, i2.start);

没有看到任何放缓。这实际上是您在这里注意到的整个运行时的第一个 lambda 表达式的初始开销。由于 Leetcode 本身在输入代码之前显然不使用 lambda 表达式，代码的执行时间会被测量，因此此开销会增加您的执行时间。

另请参阅“How will Java lambda functions be compiled?”和 “Does a lambda expression create an object on the heap every time it's executed?”

这意味着在将控制权移交给应用程序之前执行的 JDK 代码本身不使用 lambda 表达式。由于此代码源于 lambda 表达式引入之前的时代，因此通常是这种情况。使用较新的 JDK，模块化软件将由不同的较新代码进行初始化，这些代码似乎使用 lambda 表达式，因此在这些设置中，无法再在应用程序内测量运行时设施的初始化。

² 在较新的 JDK 中，初始化时间已显着减少。有不同的可能原因、一般性能改进、专用 lambda 优化或两者兼而有之。一般来说，改进初始化时间是 JDK 开发人员没有忘记的一个问题。

关于Java lambda 比匿名类慢 20 倍，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57898526/

24

4

0

文章推荐： label - gnuplot 标签中可以有多种颜色吗？

文章推荐： java - 使用堆栈计算分子质量

文章推荐： java - 如何在整数的左侧填充零？

javascript - 匿名 promise
所以 promises 对我来说是相当新的，但我喜欢这个想法。之前... 我以前用过这个，它只在文件被完全读取并按预期工作后才简单地返回数据: function something{ fo
c++ - 编译器错误{匿名}
当我尝试编译时出现以下错误: In member function 'double search::IDAstar::dfs(const State&, double)': 153:18: erro
c# - 匿名 lambda ？
最接近下面的是什么？不幸的是，下面的方法名称编译错误。 int val = delegate(string s) { return 1; }("test"); 我也尝试了 (...)=>{..
wordpress评论有时出现(匿名)的现象解决方案
1、评论提交超时：大家可能会发现，在提交评论非常缓慢时最容易出现“匿名”现象，这种情况主要是由于评论提交时执行时间过长引起的，可能是装了比较耗时的插件(比如Akismet等)；很多博
lua - 在同一个(匿名)表中使用表键
我想在同一个表中使用一个键插入一个匿名表，如下所示: loadstring( [[return { a = "One", b = a.." two" }]] ) 在我看来，这应该返回下表: {
email - 匿名 SMTP 服务
有人知道免费的匿名 smtp 服务吗？我想让我的应用程序的用户能够偶尔向我发送一封匿名电子邮件，而无需配置输入他们电子邮件帐户的服务器。我想我可以为此目的设置一个 gmail 帐户并将凭据嵌入到应用程
plsql - 匿名 block 内的更新失败但可以解决
我有这个数据补丁: ALTER TABLE MY_TABLE ADD new_id number; DECLARE MAX_ID NUMBER; BEGIN SELECT max(id)
python - 匿名 Pandas 数据框列
假设我有以下数据框。 Person_info (Bob, 2) (John, 1) (Bek, 10) (Bob, 6) 我想通过保持它们的值(value)来匿名。 Person_info (Pers
ip - 匿名 IPv6 地址
根据多个国家/地区的法律要求，我们在日志文件中匿名化用户的 IP 地址。使用 IPv4，我们通常只是匿名化最后两个字节，例如。而不是 255.255.255.255我们记录255.255.\*.\*
syntax - 匿名 Scala 函数语法
我正在学习有关 Scala 的更多信息，但在理解 http://www.scala-lang.org/node/135 中的匿名函数示例时遇到了一些麻烦。 .我复制了下面的整个代码块: object
Drupal 商务愿望 list 匿名
我正在开设一个 Commerce 网上商店。我想添加 Commerce 愿望 list ，但现在该模块仅适用于注册用户，因为未注册它不起作用。我将显示 block 中的角色设置为匿名，但即使在更改
javascript - 匿名 Google 云端硬盘上传创建新文件夹
我正在使用发现的 Google Apps 脚本 here让匿名用户将文件上传到我的 Google 云端硬盘。我想要的是脚本使用表单上输入的名称创建一个文件夹，然后将文件存放在该文件夹中。到目前为止
javascript - 匿名 setTimeout 函数
我遇到的情况是，我正在等待一些事件的发生。我看到很多关于如何使用命名函数使用 setTimeout 的好例子，但是有没有办法使用某种匿名方法来设置超时？代码目前看起来像这样: testForObje
java - 什么时候使用(匿名)内部类是安全泄漏的？
我一直在阅读一些关于 Android 内存泄漏的文章，并观看了来自 Google I/O 的这个有趣的视频 on the subject . 尽管如此，我仍然不完全理解这个概念，尤其是当它对用户安全或
java - Spring 匿名/回调类用于数据持久化的困难时期
我正在尝试适应 Spring JDBC，但让我烦恼的是使用这些匿名类，我们不能传递任何局部变量，除非它们是最终的，这可能很容易安排，但是如果我需要循环一个怎么办？数组还是集合？我无法将“FedMode
.net - 匿名 Oracle 参数？
我正在尝试将数据输入到 Oracle 数据库中。这将是一个带有多个参数的存储过程……我的意思是像 27 个参数(别问，我没有设计它)…… 现在我必须以某种方式填充此存储过程的参数...存储过程采用的大
scala - 匿名 PartialFunction 语法
我之前问过这个问题:Combine a PartialFunction with a regular function 然后意识到，我实际上并没有问对。所以，这是另一个尝试。如果我这样做: va
javascript - 匿名 qt 脚本函数的上下文？
我想从 C++ 执行一个匿名的 Qt 脚本函数，但不知道要使用的 QScriptContext。这是脚本: { otherObject.Text = "Hello World"; setTi
JavaScript:匿名 promise 解析器函数中的递归
我有一个返回 promise 的函数。 (本例中为 foo) 我尝试在声明为匿名的解析函数中调用此函数。我已经尝试过使用this 但这不起作用。我的代码是这样的 var foo = functio
c# - 匿名 JSON 对象集合的单元测试
这个问题的灵感来自这个 excellent example .我有 ASP.NET Core MVC 应用程序，我正在编写 unit tests为 Controller 。其中一种方法返回带有匿名类型

首页

博学

6Ren·AI

商城

Java lambda 比匿名类慢 20 倍