- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我曾经评论过here .
我建议应该使用 a.length/2
预先声明该限制。一个人告诉他,他相信编译器无论如何都会增强它
所以我尝试了。
public class Loop1 {
public static void main(final String[] args) {
final String[] a = {};
for (int i = 0; i < a.length / 2; i++) {
}
}
}
public class Loop2 {
public static void main(final String[] args) {
final String[] a = {};
final int l = a.length / 2;
for (int i = 0; i < l; i++) {
}
}
}
当我用 javap
打印这些类时,我得到了。
Loop1.javap.txt
...
7: iload_2 <----- for loop?
8: aload_1 |
9: arraylength <----|---- a.length?
10: iconst_2 |
11: idiv |
12: if_icmpge 21 |
15: iinc 2, 1 |
18: goto 7 -----
...
Loop2.javap.txt
...
6: arraylength <---- ---- a.length?
7: iconst_2
8: idiv
9: istore_2
10: iconst_0
11: istore_3
12: iload_3 <----- for loop?
13: iload_2 |
14: if_icmpge 23 |
17: iinc 3, 1 |
20: goto 12 -----
...
问题是我无法读取字节码。
编译器实际上是否使用 Loop1.java 优化了 a.length/2
部分?
最佳答案
虽然实际的答案(“不,它没有”)已经被接受,但我对这种情况很好奇,并认为这是一个深入了解 JIT 优化和热点反汇编世界的机会。
所以我创建了一个类
class Test03
{
public static void main(String args[])
{
for (int i=1000; i<12000; i++)
{
int counter0 = callVar();
System.out.println(counter0);
int counter1 = callDiv();
System.out.println(counter1);
}
}
public static int callDiv()
{
int sum = 0;
final int a[] = new int[0xCAFE];
for (
int i = 0;
i < a.length / 2;
i++)
{
sum+=a[i];
}
return sum;
}
public static int callVar()
{
int sum = 0;
final int a[] = new int[0xCAFE];
int x = a.length / 2;
for (
int i = 0;
i < x;
i++)
{
sum+=a[i];
}
return sum;
}
}
并执行此操作
java" -server -XX:+UnlockDiagnosticVMOptions -XX:+TraceClassLoading -XX:+LogCompilation -XX:+PrintAssembly Test03
(注意:为了完成这项工作,需要“HotSpot disassembler”二进制文件。构建它(和预编译的)的说明可以在网上找到)。
这会创建一个巨大的hotspot.log
文件,其中包含有关热点编译器执行的优化的所有信息。
(提示:这个文件很难分析。但是,有人已经开始创建一个优秀工具来分析热点日志文件:https://github.com/AdoptOpenJDK/jitwatch)
在本例中,我只对 callDiv
和 callVar
方法的汇编代码感兴趣。
callDiv
方法的程序集如下所示(没有理由真正阅读它...)
Decoding compiled method 0x000000000269f890:
Code:
[Entry Point]
[Verified Entry Point]
[Constants]
# {method} 'callDiv' '()I' in 'Test03'
# [sp+0x20] (sp of caller)
0x000000000269f9e0: mov %eax,-0x6000(%rsp)
0x000000000269f9e7: push %rbp
0x000000000269f9e8: sub $0x10,%rsp ;*synchronization entry
; - Test03::callDiv@-1 (line 17)
0x000000000269f9ec: mov 0x60(%r15),%r8
0x000000000269f9f0: mov %r8,%r10
0x000000000269f9f3: add $0x32c08,%r10
0x000000000269f9fa: cmp 0x70(%r15),%r10
0x000000000269f9fe: jae 0x000000000269fae5
0x000000000269fa04: mov %r10,0x60(%r15)
0x000000000269fa08: prefetchnta 0xc0(%r10)
0x000000000269fa10: movq $0x1,(%r8)
0x000000000269fa17: prefetchnta 0x100(%r10)
0x000000000269fa1f: movl $0xef5c0232,0x8(%r8) ; {oop({type array int})}
0x000000000269fa27: prefetchnta 0x140(%r10)
0x000000000269fa2f: movl $0xcafe,0xc(%r8)
0x000000000269fa37: prefetchnta 0x180(%r10)
0x000000000269fa3f: mov %r8,%rdi
0x000000000269fa42: add $0x10,%rdi
0x000000000269fa46: mov $0x657f,%ecx
0x000000000269fa4b: xor %eax,%eax
0x000000000269fa4d: rep stos %rax,%es:(%rdi) ;*newarray
; - Test03::callDiv@4 (line 18)
0x000000000269fa50: xor %eax,%eax
0x000000000269fa52: mov $0x1,%r11d
0x000000000269fa58: nopl 0x0(%rax,%rax,1) ;*iload_0
; - Test03::callDiv@17 (line 24)
0x000000000269fa60: add 0x10(%r8,%r11,4),%eax
0x000000000269fa65: add 0x14(%r8,%r11,4),%eax
0x000000000269fa6a: add 0x18(%r8,%r11,4),%eax
0x000000000269fa6f: add 0x1c(%r8,%r11,4),%eax
0x000000000269fa74: add 0x20(%r8,%r11,4),%eax
0x000000000269fa79: add 0x24(%r8,%r11,4),%eax
0x000000000269fa7e: add 0x28(%r8,%r11,4),%eax
0x000000000269fa83: add 0x2c(%r8,%r11,4),%eax
0x000000000269fa88: add 0x30(%r8,%r11,4),%eax
0x000000000269fa8d: add 0x34(%r8,%r11,4),%eax
0x000000000269fa92: add 0x38(%r8,%r11,4),%eax
0x000000000269fa97: add 0x3c(%r8,%r11,4),%eax
0x000000000269fa9c: add 0x40(%r8,%r11,4),%eax
0x000000000269faa1: add 0x44(%r8,%r11,4),%eax
0x000000000269faa6: add 0x48(%r8,%r11,4),%eax
0x000000000269faab: add 0x4c(%r8,%r11,4),%eax ;*iadd
; - Test03::callDiv@21 (line 24)
0x000000000269fab0: add $0x10,%r11d ;*iinc
; - Test03::callDiv@23 (line 22)
0x000000000269fab4: cmp $0x6570,%r11d
0x000000000269fabb: jl 0x000000000269fa60 ;*if_icmpge
; - Test03::callDiv@14 (line 21)
0x000000000269fabd: cmp $0x657f,%r11d
0x000000000269fac4: jge 0x000000000269fad9
0x000000000269fac6: xchg %ax,%ax ;*iload_0
; - Test03::callDiv@17 (line 24)
0x000000000269fac8: add 0x10(%r8,%r11,4),%eax ;*iadd
; - Test03::callDiv@21 (line 24)
0x000000000269facd: inc %r11d ;*iinc
; - Test03::callDiv@23 (line 22)
0x000000000269fad0: cmp $0x657f,%r11d
0x000000000269fad7: jl 0x000000000269fac8
0x000000000269fad9: add $0x10,%rsp
0x000000000269fadd: pop %rbp
0x000000000269fade: test %eax,-0x245fae4(%rip) # 0x0000000000240000
; {poll_return}
0x000000000269fae4: retq
0x000000000269fae5: mov $0xcafe,%r8d
0x000000000269faeb: movabs $0x77ae01190,%rdx ; {oop({type array int})}
0x000000000269faf5: xchg %ax,%ax
0x000000000269faf7: callq 0x000000000269e720 ; OopMap{off=284}
;*newarray
; - Test03::callDiv@4 (line 18)
; {runtime_call}
0x000000000269fafc: mov %rax,%r8
0x000000000269faff: jmpq 0x000000000269fa50 ;*newarray
; - Test03::callDiv@4 (line 18)
0x000000000269fb04: mov %rax,%rdx
0x000000000269fb07: add $0x10,%rsp
0x000000000269fb0b: pop %rbp
0x000000000269fb0c: jmpq 0x00000000026a1760 ; {runtime_call}
0x000000000269fb11: hlt
0x000000000269fb12: hlt
0x000000000269fb13: hlt
0x000000000269fb14: hlt
0x000000000269fb15: hlt
0x000000000269fb16: hlt
0x000000000269fb17: hlt
0x000000000269fb18: hlt
0x000000000269fb19: hlt
0x000000000269fb1a: hlt
0x000000000269fb1b: hlt
0x000000000269fb1c: hlt
0x000000000269fb1d: hlt
0x000000000269fb1e: hlt
0x000000000269fb1f: hlt
[Exception Handler]
[Stub Code]
0x000000000269fb20: jmpq 0x000000000269e8e0 ; {no_reloc}
[Deopt Handler Code]
0x000000000269fb25: callq 0x000000000269fb2a
0x000000000269fb2a: subq $0x5,(%rsp)
0x000000000269fb2f: jmpq 0x0000000002678d00 ; {runtime_call}
0x000000000269fb34: hlt
0x000000000269fb35: hlt
0x000000000269fb36: hlt
0x000000000269fb37: hlt
<nmethod compile_id='1' compiler='C2' entry='0x000000000269f9e0' size='1000' address='0x000000000269f890' relocation_offset='288' insts_offset='336' stub_offset='656' scopes_data_offset='704' scopes_pcs_offset='760' dependencies_offset='968' handler_table_offset='976' oops_offset='680' method='Test03 callDiv ()I' bytes='31' count='5000' backedge_count='5000' iicount='10' stamp='0.736'/>
<writer thread='1316'/>
callVar
方法的程序集如下所示(没有理由真正读取它...)
Decoding compiled method 0x000000000269f490:
Code:
[Entry Point]
[Verified Entry Point]
[Constants]
# {method} 'callVar' '()I' in 'Test03'
# [sp+0x20] (sp of caller)
0x000000000269f5e0: mov %eax,-0x6000(%rsp)
0x000000000269f5e7: push %rbp
0x000000000269f5e8: sub $0x10,%rsp ;*synchronization entry
; - Test03::callVar@-1 (line 31)
0x000000000269f5ec: mov 0x60(%r15),%r8
0x000000000269f5f0: mov %r8,%r10
0x000000000269f5f3: add $0x32c08,%r10
0x000000000269f5fa: cmp 0x70(%r15),%r10
0x000000000269f5fe: jae 0x000000000269f6e5
0x000000000269f604: mov %r10,0x60(%r15)
0x000000000269f608: prefetchnta 0xc0(%r10)
0x000000000269f610: movq $0x1,(%r8)
0x000000000269f617: prefetchnta 0x100(%r10)
0x000000000269f61f: movl $0xef5c0232,0x8(%r8) ; {oop({type array int})}
0x000000000269f627: prefetchnta 0x140(%r10)
0x000000000269f62f: movl $0xcafe,0xc(%r8)
0x000000000269f637: prefetchnta 0x180(%r10)
0x000000000269f63f: mov %r8,%rdi
0x000000000269f642: add $0x10,%rdi
0x000000000269f646: mov $0x657f,%ecx
0x000000000269f64b: xor %eax,%eax
0x000000000269f64d: rep stos %rax,%es:(%rdi) ;*newarray
; - Test03::callVar@4 (line 32)
0x000000000269f650: xor %eax,%eax
0x000000000269f652: mov $0x1,%r11d
0x000000000269f658: nopl 0x0(%rax,%rax,1) ;*iload_0
; - Test03::callVar@19 (line 39)
0x000000000269f660: add 0x10(%r8,%r11,4),%eax
0x000000000269f665: add 0x14(%r8,%r11,4),%eax
0x000000000269f66a: add 0x18(%r8,%r11,4),%eax
0x000000000269f66f: add 0x1c(%r8,%r11,4),%eax
0x000000000269f674: add 0x20(%r8,%r11,4),%eax
0x000000000269f679: add 0x24(%r8,%r11,4),%eax
0x000000000269f67e: add 0x28(%r8,%r11,4),%eax
0x000000000269f683: add 0x2c(%r8,%r11,4),%eax
0x000000000269f688: add 0x30(%r8,%r11,4),%eax
0x000000000269f68d: add 0x34(%r8,%r11,4),%eax
0x000000000269f692: add 0x38(%r8,%r11,4),%eax
0x000000000269f697: add 0x3c(%r8,%r11,4),%eax
0x000000000269f69c: add 0x40(%r8,%r11,4),%eax
0x000000000269f6a1: add 0x44(%r8,%r11,4),%eax
0x000000000269f6a6: add 0x48(%r8,%r11,4),%eax
0x000000000269f6ab: add 0x4c(%r8,%r11,4),%eax ;*iadd
; - Test03::callVar@23 (line 39)
0x000000000269f6b0: add $0x10,%r11d ;*iinc
; - Test03::callVar@25 (line 37)
0x000000000269f6b4: cmp $0x6570,%r11d
0x000000000269f6bb: jl 0x000000000269f660 ;*if_icmpge
; - Test03::callVar@16 (line 36)
0x000000000269f6bd: cmp $0x657f,%r11d
0x000000000269f6c4: jge 0x000000000269f6d9
0x000000000269f6c6: xchg %ax,%ax ;*iload_0
; - Test03::callVar@19 (line 39)
0x000000000269f6c8: add 0x10(%r8,%r11,4),%eax ;*iadd
; - Test03::callVar@23 (line 39)
0x000000000269f6cd: inc %r11d ;*iinc
; - Test03::callVar@25 (line 37)
0x000000000269f6d0: cmp $0x657f,%r11d
0x000000000269f6d7: jl 0x000000000269f6c8
0x000000000269f6d9: add $0x10,%rsp
0x000000000269f6dd: pop %rbp
0x000000000269f6de: test %eax,-0x245f6e4(%rip) # 0x0000000000240000
; {poll_return}
0x000000000269f6e4: retq
0x000000000269f6e5: mov $0xcafe,%r8d
0x000000000269f6eb: movabs $0x77ae01190,%rdx ; {oop({type array int})}
0x000000000269f6f5: xchg %ax,%ax
0x000000000269f6f7: callq 0x000000000269e720 ; OopMap{off=284}
;*newarray
; - Test03::callVar@4 (line 32)
; {runtime_call}
0x000000000269f6fc: mov %rax,%r8
0x000000000269f6ff: jmpq 0x000000000269f650 ;*newarray
; - Test03::callVar@4 (line 32)
0x000000000269f704: mov %rax,%rdx
0x000000000269f707: add $0x10,%rsp
0x000000000269f70b: pop %rbp
0x000000000269f70c: jmpq 0x00000000026a1760 ; {runtime_call}
0x000000000269f711: hlt
0x000000000269f712: hlt
0x000000000269f713: hlt
0x000000000269f714: hlt
0x000000000269f715: hlt
0x000000000269f716: hlt
0x000000000269f717: hlt
0x000000000269f718: hlt
0x000000000269f719: hlt
0x000000000269f71a: hlt
0x000000000269f71b: hlt
0x000000000269f71c: hlt
0x000000000269f71d: hlt
0x000000000269f71e: hlt
0x000000000269f71f: hlt
[Exception Handler]
[Stub Code]
0x000000000269f720: jmpq 0x000000000269e8e0 ; {no_reloc}
[Deopt Handler Code]
0x000000000269f725: callq 0x000000000269f72a
0x000000000269f72a: subq $0x5,(%rsp)
0x000000000269f72f: jmpq 0x0000000002678d00 ; {runtime_call}
0x000000000269f734: hlt
0x000000000269f735: hlt
0x000000000269f736: hlt
0x000000000269f737: hlt
<nmethod compile_id='2' compiler='C2' entry='0x000000000269f5e0' size='1000' address='0x000000000269f490' relocation_offset='288' insts_offset='336' stub_offset='656' scopes_data_offset='704' scopes_pcs_offset='760' dependencies_offset='968' handler_table_offset='976' oops_offset='680' method='Test03 callVar ()I' bytes='33' count='5000' backedge_count='5000' iicount='11' stamp='0.832'/>
<writer thread='10020'/>
我从来没有真正熟悉过 X86 汇编程序(除了一些自学的基础知识之外)。然而,例如,JIT 似乎正在将循环展开为 16 个元素的 block - 至少,这是我认为在 16 个 add
指令中看到的内容。
但重要的事情是:为这两种方法生成的指令相同。因此,正如预期的那样,JIT 确实优化了该部门。
当然,这个例子有点无聊:数组的长度是固定的,所以这个优化特别容易。 (嗯......不是那么“容易”,我可以编写一个能够执行类似操作的 JIT 虚拟机,但是......你知道我的意思)。我还尝试通过更改方法来使这变得更有趣,以便它们接受数组长度的参数:
public static int callDiv(int arrayLength)
{
final int a[] = new int[arrayLength];
...
}
但在本例中,两种方法变体之间至少存在轻微差异。虽然我相当确定在这种情况下该部门也已被优化,但我完全确定,所以我将最终决定权留给了那里的汇编专家......
关于java - 编译器优化字节码的案例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22707936/
比较代码: const char x = 'a'; std::cout > (0C310B0h) 00C3100B add esp,4 和 const i
您好,我正在使用 Matlab 优化求解器,但程序有问题。我收到此消息 fmincon 已停止,因为目标函数值小于目标函数限制的默认值,并且约束满足在约束容差的默认值范围内。我也收到以下消息。警告:矩
处理Visual Studio optimizations的问题为我节省了大量启动和使用它的时间 当我必须进行 J2EE 开发时,我很难回到 Eclipse。因此,我还想知道人们是否有任何提示或技巧可
情况如下:在我的 Excel 工作表中,有一列包含 1-name 形式的条目。考虑到数字也可以是两位数,我想删除这些数字。这本身不是问题,我让它工作了,只是性能太糟糕了。现在我的程序每个单元格输入大约
这样做有什么区别吗: $(".topHorzNavLink").click(function() { var theHoverContainer = $("#hoverContainer");
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: What is the cost of '$(this)'? 我经常在一些开发人员代码中看到$(this)引用同一个
我刚刚结束了一个大型开发项目。我们的时间紧迫,因此很多优化被“推迟”。既然我们已经达到了最后期限,我们将回去尝试优化事情。 我的问题是:优化 jQuery 网站时您要寻找的最重要的东西是什么。或者,我
所以我一直在用 JavaScript 编写游戏(不是网络游戏,而是使用 JavaScript 恰好是脚本语言的游戏引擎)。不幸的是,游戏引擎的 JavaScript 引擎是 SpiderMonkey
这是我在正在构建的页面中使用的 SQL 查询。它目前运行大约 8 秒并返回 12000 条记录,这是正确的,但我想知道您是否可以就如何使其更快提出可能的建议? SELECT DISTINCT Adve
如何优化这个? SELECT e.attr_id, e.sku, a.value FROM product_attr AS e, product_attr_text AS a WHERE e.attr
我正在使用这样的结构来测试是否按下了所需的键: def eventFilter(self, tableView, event): if event.type() == QtCore.QEven
我正在使用 JavaScript 从给定的球员列表中计算出羽毛球 double 比赛的所有组合。每个玩家都与其他人组队。 EG。如果我有以下球员a、b、c、d。它们的组合可以是: a & b V c
我似乎无法弄清楚如何让这个 JS 工作。 scroll function 起作用但不能隐藏。还有没有办法用更少的代码行来做到这一点?我希望 .down-arrow 在 50px 之后 fade out
我的问题是关于用于生产的高级优化级联样式表 (CSS) 文件。 多么最新和最完整(准备在实时元素中使用)的 css 优化器/最小化器,它们不仅提供删除空格和换行符,还提供高级功能,如删除过多的属性、合
我读过这个: 浏览器检索在 中请求的所有资源开始呈现 之前的 HTML 部分.如果您将请求放在 中section 而不是,那么页面呈现和下载资源可以并行发生。您应该从 移动尽可能多的资源请求。
我正在处理一些现有的 C++ 代码,这些代码看起来写得不好,而且调用频率很高。我想知道我是否应该花时间更改它,或者编译器是否已经在优化问题。 我正在使用 Visual Studio 2008。 这是一
我正在尝试使用 OpenGL 渲染 3 个四边形(1 个背景图,2 个 Sprite )。我有以下代码: void GLRenderer::onDrawObjects(long p_dt) {
我确实有以下声明: isEnabled = false; if(foo(arg) && isEnabled) { .... } public boolean foo(arg) { some re
(一)深入浅出理解索引结构 实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(no
一、写在前面 css的优化方案,之前没有提及,所以接下来进行总结一下。 二、具体优化方案 2.1、加载性能 1、css压缩:将写好的css进行打包,可以减少很多的体积。 2、css单一样式:在需要下边
我是一名优秀的程序员,十分优秀!