gpt4 book ai didi

java - 使用中间变量而不是 array.length 会使你的 for 循环更快吗?

转载 作者:IT老高 更新时间:2023-10-28 21:16:16 24 4
gpt4 key购买 nike

"Performance Tips" section in the Android documentation有一个非常大胆的主张:

one() is faster. It pulls everything out into local variables, avoiding the lookups. Only the array length offers a performance benefit.

它在哪里引用此代码片段:

int len = localArray.length;

for (int i = 0; i < len; ++i) {
sum += localArray[i].mSplat;
}

这让我很惊讶,因为 localArray.length 只是访问一个整数,如果您使用中间变量,则必须再次执行完全相同的步骤。我们真的是说只需要转到 x 而不是 y.x 的中间变量更快吗?

我看了看this question这几乎是相同的想法,但使用 arraylist 及其后续的 .size() 方法。这里的共识似乎是没有区别,因为无论如何该方法调用可能只是内联到整数访问(这正是我们这里的场景)。

所以我用字节码来看看它是否能告诉我什么。

给出以下源代码:

public void MethodOne() {
int[] arr = new int[5];
for (int i = 0; i < arr.length; i++) { }
}

public void MethodTwo() {
int[] arr = new int[5];
int len = arr.length;
for (int i = 0; i < len; i++) { }
}

我得到以下字节码:

public void MethodOne();
Code:
0: iconst_5
1: newarray int
3: astore_1
4: iconst_0
5: istore_2
6: iload_2
7: aload_1
8: arraylength
9: if_icmpge 18
12: iinc 2, 1
15: goto 6
18: return

public void MethodTwo();
Code:
0: iconst_5
1: newarray int
3: astore_1
4: aload_1
5: arraylength
6: istore_2
7: iconst_0
8: istore_3
9: iload_3
10: iload_2
11: if_icmpge 20
14: iinc 3, 1
17: goto 9
20: return

它们在以下说明中有所不同:

方法一

6: iload_2
7: aload_1
8: arraylength
9: if_icmpge 18
12: iinc 2, 1
15: goto 6
18: return

方法二

9: iload_3
10: iload_2
11: if_icmpge 20
14: iinc 3, 1
17: goto 9
20: return

现在,我不能 100% 确定我必须如何解释 8: arraylength 但我 认为 这只是表示您正在访问的字段。第一种方法加载索引计数器和数组并访问 arraylength 字段,而第二种方法加载索引计数器和中间变量。

我还使用 JMH(10 次预热、10 次迭代、5 次 fork )对这两种方法进行了基准测试,结果如下:

c.m.m.Start.MethodOne    thrpt        50  3447184.351    19973.900   ops/ms
c.m.m.Start.MethodTwo thrpt 50 3435112.281 32639.755 ops/ms

这告诉我差异可以忽略不计甚至不存在。


Android 文档声称在循环条件中使用中间变量的依据是什么?

最佳答案

您误解了文档。他们不是指您所描述的内容(尽管我不怪您,但他们应该在这些文档中投入更多精力:))。

It pulls everything out into local variables, avoiding the lookups.

通过避免查找他们指的是field vs local variable access cost .访问字段(文档示例中的 mArray)需要先加载 this,然后根据 this 的固定偏移量加载字段。

一段时间后,JIT 可能会弄清楚发生了什么并优化字段访问(如果该字段不是 volatile 或循环中发生某种其他形式的同步)并重写代码,以便所有参与循环的变量都在 CPU 寄存器和缓存中被访问/更改,直到循环结束。

一般来说,与存储在局部变量中的引用相比,JIT 可能需要做更多的工作来确定优化对从字段引用的数组长度的访问是否安全。假设我们有以下循环:

for (int i = 0; i < array.length; ++i) {
process(array[i]);
}

如果 array 是一个字段并且 process 调用了数千行复杂的代码,那么 JIT 可能会发现很难检查 array字段在循环中的某处被更改以引用其他具有不同长度的数组。

显然,在这种情况下检查局部变量是否改变要容易得多(三行代码)。

关于java - 使用中间变量而不是 array.length 会使你的 for 循环更快吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32011188/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com