java - 为什么在 x64 Java 中 long 比 int 慢？-6ren

java - 为什么在 x64 Java 中 long 比 int 慢？

转载作者：IT老高更新时间：2023-10-28 11:35:12

24

4

我在 Surface Pro 2 平板电脑上运行 Windows 8.1 x64 和 Java 7 更新 45 x64(未安装 32 位 Java)。

当 i 的类型是 long 时，下面的代码需要 1688 毫秒，而当 i 是 int 时，需要 109 毫秒。为什么在带有 64 位 JVM 的 64 位平台上 long(64 位类型)比 int 慢一个数量级？

我唯一的猜测是 CPU 添加 64 位整数比添加 32 位整数需要更长的时间，但这似乎不太可能。我怀疑 Haswell 不使用波纹进位加法器。

我在 Eclipse Kepler SR1 中运行它，顺便说一句。

public class Main {

    private static long i = Integer.MAX_VALUE;

    public static void main(String[] args) {    
        System.out.println("Starting the loop");
        long startTime = System.currentTimeMillis();
        while(!decrementAndCheck()){
        }
        long endTime = System.currentTimeMillis();
        System.out.println("Finished the loop in " + (endTime - startTime) + "ms");
    }

    private static boolean decrementAndCheck() {
        return --i < 0;
    }

}

编辑:这是由 VS 2013(下)在同一系统编译的等效 C++ 代码的结果。 ~~long: 72265ms int: 74656ms~~ 这些结果在调试 32 位模式下。

64位 Release模式下:~~long: 875ms~~ long long: 906ms int: 1047ms

这表明我观察到的结果是 JVM 优化异常而不是 CPU 限制。

#include "stdafx.h"
#include "iostream"
#include "windows.h"
#include "limits.h"

long long i = INT_MAX;

using namespace std;


boolean decrementAndCheck() {
return --i < 0;
}


int _tmain(int argc, _TCHAR* argv[])
{


cout << "Starting the loop" << endl;

unsigned long startTime = GetTickCount64();
while (!decrementAndCheck()){
}
unsigned long endTime = GetTickCount64();

cout << "Finished the loop in " << (endTime - startTime) << "ms" << endl;



}

编辑:刚刚在 Java 8 RTM 中再次尝试过，没有重大变化。

最佳答案

当你使用 longs:

0x00007fdd859dbb80: test   %eax,0x5f7847a(%rip)  /* fun JVM hack */
0x00007fdd859dbb86: dec    %r11                  /* i-- */
0x00007fdd859dbb89: mov    %r11,0x258(%r10)      /* store i to memory */
0x00007fdd859dbb90: test   %r11,%r11             /* unnecessary test */
0x00007fdd859dbb93: jge    0x00007fdd859dbb80    /* go back to the loop top */

当你使用 ints 时，它会作弊，很难；首先有一些我没有声称理解但看起来像展开循环的设置:

0x00007f3dc290b5a1: mov    %r11d,%r9d
0x00007f3dc290b5a4: dec    %r9d
0x00007f3dc290b5a7: mov    %r9d,0x258(%r10)
0x00007f3dc290b5ae: test   %r9d,%r9d
0x00007f3dc290b5b1: jl     0x00007f3dc290b662
0x00007f3dc290b5b7: add    $0xfffffffffffffffe,%r11d
0x00007f3dc290b5bb: mov    %r9d,%ecx
0x00007f3dc290b5be: dec    %ecx              
0x00007f3dc290b5c0: mov    %ecx,0x258(%r10)   
0x00007f3dc290b5c7: cmp    %r11d,%ecx
0x00007f3dc290b5ca: jle    0x00007f3dc290b5d1
0x00007f3dc290b5cc: mov    %ecx,%r9d
0x00007f3dc290b5cf: jmp    0x00007f3dc290b5bb
0x00007f3dc290b5d1: and    $0xfffffffffffffffe,%r9d
0x00007f3dc290b5d5: mov    %r9d,%r8d
0x00007f3dc290b5d8: neg    %r8d
0x00007f3dc290b5db: sar    $0x1f,%r8d
0x00007f3dc290b5df: shr    $0x1f,%r8d
0x00007f3dc290b5e3: sub    %r9d,%r8d
0x00007f3dc290b5e6: sar    %r8d
0x00007f3dc290b5e9: neg    %r8d
0x00007f3dc290b5ec: and    $0xfffffffffffffffe,%r8d
0x00007f3dc290b5f0: shl    %r8d
0x00007f3dc290b5f3: mov    %r8d,%r11d
0x00007f3dc290b5f6: neg    %r11d
0x00007f3dc290b5f9: sar    $0x1f,%r11d
0x00007f3dc290b5fd: shr    $0x1e,%r11d
0x00007f3dc290b601: sub    %r8d,%r11d
0x00007f3dc290b604: sar    $0x2,%r11d
0x00007f3dc290b608: neg    %r11d
0x00007f3dc290b60b: and    $0xfffffffffffffffe,%r11d
0x00007f3dc290b60f: shl    $0x2,%r11d
0x00007f3dc290b613: mov    %r11d,%r9d
0x00007f3dc290b616: neg    %r9d
0x00007f3dc290b619: sar    $0x1f,%r9d
0x00007f3dc290b61d: shr    $0x1d,%r9d
0x00007f3dc290b621: sub    %r11d,%r9d
0x00007f3dc290b624: sar    $0x3,%r9d
0x00007f3dc290b628: neg    %r9d
0x00007f3dc290b62b: and    $0xfffffffffffffffe,%r9d
0x00007f3dc290b62f: shl    $0x3,%r9d
0x00007f3dc290b633: mov    %ecx,%r11d
0x00007f3dc290b636: sub    %r9d,%r11d
0x00007f3dc290b639: cmp    %r11d,%ecx
0x00007f3dc290b63c: jle    0x00007f3dc290b64f
0x00007f3dc290b63e: xchg   %ax,%ax /* OK, fine; I know what a nop looks like */

然后是展开的循环本身:

0x00007f3dc290b640: add    $0xfffffffffffffff0,%ecx
0x00007f3dc290b643: mov    %ecx,0x258(%r10)
0x00007f3dc290b64a: cmp    %r11d,%ecx
0x00007f3dc290b64d: jg     0x00007f3dc290b640

然后是展开循环的拆解代码，它本身就是一个测试和一个直接循环:

0x00007f3dc290b64f: cmp    $0xffffffffffffffff,%ecx
0x00007f3dc290b652: jle    0x00007f3dc290b662
0x00007f3dc290b654: dec    %ecx
0x00007f3dc290b656: mov    %ecx,0x258(%r10)
0x00007f3dc290b65d: cmp    $0xffffffffffffffff,%ecx
0x00007f3dc290b660: jg     0x00007f3dc290b654

因此，对于 int，它的速度提高了 16 倍，因为 JIT 将 int 循环展开了 16 次，但根本没有展开 long 循环。

为了完整起见，这是我实际尝试过的代码:

public class foo136 {
  private static int i = Integer.MAX_VALUE;
  public static void main(String[] args) {
    System.out.println("Starting the loop");
    for (int foo = 0; foo < 100; foo++)
      doit();
  }

  static void doit() {
    i = Integer.MAX_VALUE;
    long startTime = System.currentTimeMillis();
    while(!decrementAndCheck()){
    }
    long endTime = System.currentTimeMillis();
    System.out.println("Finished the loop in " + (endTime - startTime) + "ms");
  }

  private static boolean decrementAndCheck() {
    return --i < 0;
  }
}

程序集转储是使用选项 -XX:+UnlockDiagnosticVMOptions -XX:+PrintAssembly 生成的。请注意，您需要弄乱您的 JVM 安装才能让这项工作也为您服务；您需要将一些随机共享库放在正确的位置，否则它会失败。

关于java - 为什么在 x64 Java 中 long 比 int 慢？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19844048/

24

4

0

文章推荐： iphone - 如何对包含 N 个数字的 NSMutableArray 进行排序？

文章推荐： objective-c - 从 URL Objective C 获取图像

文章推荐： c++ - 在自己的花括号内循环

c++ - 是 "long long"= "long long int"= "long int long"= "int long long"吗？
我找到了long int long和 int long long可以编译为变量类型。 long int long有什么区别吗, int long long , long long和 long long
java - Prince 类型中的方法 Encrypt(long, long, long, long, int) 不适用于参数 (String, long, long, long, int)
我无法找出为什么“加密”函数仍然将“消息”读取为字符串，尽管我已经使用不同的方法将数据类型更改为字节。错误消息是“Prince 类型中的方法 Encrypt(long, long, long, lo
c++ - "long"和 "long int"以及 "long long"与 "long long int"之间有什么区别
这个问题在这里已经有了答案: Is "long long" = "long long int" = "long int long" = "int long long"? (4 个答案) 关闭 6 年
c++ - C++ 中的 "long"、 "long long"、 "long int"和 "long long int"有什么区别？
我正在从 Java 过渡到 C++，并且对 long 数据类型有一些疑问。在 Java 中，要保存大于 232 的整数，您只需编写 long x;。但是，在 C++ 中，long 似乎既是数据类型又是
C++ - unsigned long long 到有符号 long long 的隐式转换？
clang-tidy 12.0.1 报告了一个相当奇怪的警告。在以下代码中: #include int main() { std::vector v1; const auto a =
c++ - 如何将起始地址分配给 map,long long int > 的迭代器
我创建了一个 pair 和 long long int 的映射 - map,long long int >; 和一个交互器 - map, long long int >::iterator it1;
c++ - unsigned long long VS unsigned long long int
我想知道 unsigned long long 和 unsigned long long int 的主要区别。它们可以互换使用吗？对于像 9223372036854775807 这样的大十进制数的计
c++ - 缩写类型名称 long long 与 long long int，是否符合标准？
我看到的大多数代码都使用缩写类型来声明变量，例如 long long x; // long long int x short y; // short int y 我浏览了 C++11 标准(第 3.9
c++ - 为什么 common_type::type = long long？
common_type::type是 unsigned long因为关于积分提升后的操作数，标准说... [...] if the operand that has unsigned integer
C : erroneous output for "(long long int) = (long long int) * (double)"?
long long int A = 3289168178315264; long long int B = 1470960727228416; double D = sqrt(5); long lon
c++ - "long int", "long long"数据类型
这些新数据类型的目的是什么？我通常只使用“int”或“long”，但为什么会存在这些呢？它们带来了什么新功能或用途？最佳答案 long int一直是long的全称，只是很少用而已。 long lon
c++ - for 循环运行 long long int 但不是 unsigned long long int
我正在运行以下for循环 for(unsigned long long int i = N-1; i >= 0; i--){ cin>>L[i]; } 当程序到达这个代码段时，它停止响应。但是
c++ - map(long long int,long long int) 不适用于 key=1000 000 000(在 long long int 的范围内)
最近问了一个关于递归导致这个问题的问题注意-> count() 函数返回键 K 在 map 容器中出现的次数。如果键存在于容器中，则返回 1，因为映射仅包含唯一键。如果 map 容器中不存在键，则返
c - 如何将 long long int 的数字放入 long long int 数组
好的，所以我正在尝试实现客户端 - 服务器程序(套接字编程)。我的客户发送一个嵌入字符串中的 long long int，如下所示: char copy[10]; sprintf(send_data
java - Long + Long 不大于 Long.MAX_VALUE
如果我有任务 Long c = a + b; 有没有一种简单的方法来检查 a + b 不大于/小于 Long.MAX_VALUE/Long.MIN_VALUE？最佳答案使用 Guava , 就这么
java - Long 类型未定义方法 compare(long, long)
我需要制作一个 Comparator 来根据它的 long 类型的变量之一对我的对象列表进行排序。 public class ParticipantIndexComparator implements
c++ - 将 unsigned long long 与 signed long long 结果相减？
假设我有这两种类型: typedef unsigned long long uint64; typedef signed long long sint64; 我有这些变量: uint64 a = ..
c++ - long long 和 long 和有什么不一样
long long 和 long 有什么区别？而且它们都不适用于 12 位数字 (600851475143)，我是不是忘记了什么？ #include using namespace std; int
c - 当两个 long long int 给出的结果大于 long long int 时，它们的总和？
当结果将大于 C 中的 long long int 时，是否有可能对两个不同的 long long int 变量求和？最佳答案由于 OP 想要“在屏幕上打印结果”，因此将数字分成两部分:Most-
c++ - "vector distance(n, std::numeric_limits::max()); "行的含义是什么？
实际上我必须找到从源顶点到所有其他顶点的最短路径。为此，我获得了下面给出的代码模板。我想实现“Bellman–Ford algorithm”。 #include #include #include

首页

博学

6Ren·AI

商城

java - 为什么在 x64 Java 中 long 比 int 慢？