从原理聊JVM（五）：JVM的编译过程和优化手段

转载作者：我是一只小鸟更新时间：2023-08-31 07:39:22

32

4

1、前端编译

前端编译就是将Java源码文件编译成Class文件的过程，编译过程分为4步:

1 准备

初始化插入式注解处理器（Annotation Processing Tool）.

2 解析与填充符号表

将源代码的字符流转变为标记（Token）集合，构造出抽象语法树（AST） .

抽象语法树每个节点都代表着程序代码中的一个语法结构，包含包、类型、修饰符、运算符、接口、返回值、代码注释等内容.

编译器的后续行为都是基于抽象语法树来进行.

符号表可以理解为一个K-V结构的集合，存储了以下信息:

变量名和常量
过程和函数名称
文字常量和字符串
编译器生成的临时文件
源语言中的标签

编译器在运行过程中会通过符号表来方便查找所有标识.

3 注解处理器

注解处理器可以看做是一组编译器的插件，用来读写抽象语法树中任意元素.

简单来说，注解处理器的作用就是让编译器对特定注解执行特定逻辑，一般用来生成代码，比如常用的lombok和mapstruct都是基于此.

如果在这期间语法树被修改了，编译器将回到“解析与填充符号表”的过程重新处理，这个循环被称作“轮次（Round）”.

这是开发人员唯一能控制编译器行为的方式.

4 分析与字节码生成

前置步骤可以成功生成一个结构正确的语法树，语义分析则是校验语法树是否符合逻辑.

语义分析又分为四步:

4.1 标注检查

标注检查主要用来检查表量是否被声明、变量与赋值是否匹配等等.

在这个阶段，还会进行被称作“常量折叠”的优化，比如Java代码 int a = 1 + 2; ，实际编译后会被折叠为 int a = 3 ；。

4.2 数据及控制流分析

数据流分析和控制流分析是对程序上下文逻辑更进一步的验证，它可以检查出诸如程序局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理了等问题.

4.3 解语法糖

Java中存在非常多的语法糖用来简化代码实现，比如自动的装箱拆箱、泛型、变长参数等等。这些语法糖会在编译器被还原为基础语法结构，这个过程被称为解语法糖.

4.4 字节码生成

这是 javac 编译过程的最终阶段，编译器会在这个阶段把前面生成的抽象语法树、符号表生成为class文件，还进行了少量的代码添加和转换.

2、运行时编译

运行时编译的主要目的是为了将代码编译成本地代码，从而节省解释执行的时间.

但是JVM并不是启动后立刻开始执行编译，而是为了执行效率先进行解释执行。等到程序运行过程中，根据热点探测，找出热点代码后，对其进行针对性的编译来逐渐代替解释执行。所以HotSpot JVM采用的是解释器和即时编译器并存的架构.

1 使用编译执行的时机

Sun JDK主要根据方法上的一个计数器来计算是否超过阈值，如果超过则采用编译执行的方式.

调用计数器

记录方法调用次数，在client模式下默认为1500次，在server模式下默认为10000次，可通过 -XX:CompileThreshold=10000 来设置。

回边计数器

循环执行部分代码的执行次数，默认在client模式时为933，在server模式下为140，可通过 -XX:OnStackReplacePercentage=140 来设置。

2 编译模式

在编译上，Sun JDK提供两种模式：client compiler(-client)和server compiler(-server) 。

2.1 Client compiler

又称C1，较为轻量级，主要包括以下几方面:

2.1.1 方法内联

编译器所做最重要的优化是方法内联。

遵循面向对象设计，属性访问通常通过setter/getter方法而非直接调用，而此类方法调用的开销很大，特别是相对方法的代码量而言.

现在的JVM通常都会用内联代码的方式执行这些方法，举个例子:

                        
                          Order o = new Order();
o.setTotalAmount(o.getOrderAmount() * o.getCount());

而编译后的代码本质上执行的是:

                        
                          Order o = new Order();
o.orderAmount = o.orderAmount * o.count;

内联默认是开启的，可通过 -XX:-Inline 关闭，然而由于它对性能影响巨大，并不建议关闭.

方法是否内联取决于它有多热以及它的大小 .

2.1.2 去虚拟化

如发现类中的方法只提供了一个实现类，那么对于调用了此方法的代码，将进行方法内联。

                        
                          public interface Animal {
  void eat();
}

public class Cat implements Animal {
  @Override
  public void eat() {
    System.out.println("Cat eat !");
  }
}

public class Demo {
  public void execute(Animal animal){
    animal.eat();
  }
}

如果JVM中只有Cat类实现了Animal接口， execute() 方法被编译时，会演变成类似如下结构:

                        
                          public void execute() {
  System.out.println("Cat eat !");
}

即 execute() 方法直接内联了 Cat 类中 eat() 方法的内部逻辑.

2.1.3 冗余消除

冗余消除指在编译时，根据运行情况进行代码折叠或者消除。

例如:

                        
                          private static final boolean isDebug = false;

public void execute() {
  if (isDebug) {
    log.debug("do execute.");
  }
  System.out.println("done");
}

在执行C1编译后，会演变成如下结构:

                        
                          public void execute() {
  System.out.println("done");
}

这就是为什么，通常不建议直接调用 log.debug() ，而要先判断的原因.

2.2 Server complier

又称C2，较C1更为重量级，C2更多在于全局优化，而非代码块的优化.

逃逸分析。

逃逸分析指的是根据运行状况来判断方法中变量是否会被方法外部读取，如果被外部读取，则认为是逃逸的.

如果通过命令 -XX：+DoEscapeAnalysis （默认为true）开启逃逸分析，server编译器会执行较为激进的优化措施.

2.2.1 标量替换

                        
                          Point point = new Point(1, 2);
System.out.println("point.x = " + point.x + "; point.y" + point.y);

当point对象在后面执行过程中未被使用到时，代码经过编译会演变为如下结构:

                        
                          int x = 1, y = 2;
System.out.println("point.x = " + x + "; point.y" + y);

2.2.2 栈上分配

在上面的例子中，如果 point 没有逃逸，那么C2会选择在栈上直接创建 point 对象，而非堆上.

在栈上分配的好处一方面是对象创建更加快速，另一方面是回收时随着方法的结束，对象也被回收了.

2.2.3 同步削除

                        
                          Point point = new Point(1, 2);
synchronized(point) {  
  System.out.println("point.x = " + point.x);
}

经过分析如果发现 point 未逃逸，则代码会在编译后变成如下结构:

                        
                          Point point = new Point(1, 2);
System.out.println("point.x = " + point.x);

2.3 OSR（On Stack Replace，栈上替换）

OSR和C1、C2主要不同在于，OSR仅仅替换循环代码体的入口，而C1、C2替换的是方法调用的入口.

因此在OSR编译后会出现的现象是，方法的整段代码被编译了，但只有在循环代码体部分才执行编译后的机器码，而其他部分仍然是解释执行方式.

如果对方法进行编译优化，等JVM在某个方法中发现这个方法很热，需要编译，那么只有下次调用这个方法才能享受到被优化后的代码，而本次调用依旧使用优化前的代码。OSR主要就是解决这个问题，比如JVM发现方法中这个循环过热，那么仅仅编译这个循环体就好了，执行引擎也会在进入下一个循环时跳转到新编译的代码中去.

作者：京东科技康志兴。

来源：京东云开发者社区转载请注明来源。

最后此篇关于从原理聊JVM（五）：JVM的编译过程和优化手段的文章就讲到这里了,如果你想了解更多关于从原理聊JVM（五）：JVM的编译过程和优化手段的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

32

4

0

文章推荐：日志开源组件（六）AdaptiveSampling自适应采样

文章推荐： torch.nn基础学习教程|PyTorchnnBasicTutorial

文章推荐： [超详细]SpringBoot整合WebSocket

文章推荐： Web通用漏洞--sql注入

Docker通信全视角：原理、实践与技术洞察
本文全面深入地探讨了Docker容器通信技术，从基础概念、网络模型、核心组件到实战应用。详细介绍了不同网络模式及其实现，提供了容器通信的技术细节和实用案例，旨在为专业从业者提供深入的技术洞见和实
Dubbo快速上手 -- 带你了解Dubbo使用、原理
📒博客首页：崇尚学技术的科班人 🍣今天给大家带来的文章是《Dubbo快速上手 -- 带你了解Dubbo使用、原理》🍣 🍣希望各位小伙伴们能够耐心的读完这篇文章🍣 🙏博主也在学习阶段，如若发
npm install 原理
一、写在前面我们经常使用npm install ，但是你是否思考过它内部的原理是什么？ 1、执行npm install 它背后帮助我们完成了什么操作？ 2、我们会发现还有一个成为package-lo
一篇带你了解 Base64 原理
Base64 Base64 是什么?是将字节流转换成可打印字符、将可打印字符转换为字节流的一种算法。Base64 使用 64 个可打印字符来表示转换后的数据。准确的来说，Base64 不算
详细解读tornado协程(coroutine)原理
目录协程定义生成器和yield语义 Future类 IOLoop类 coroutine函数装饰器总结 tornado中的
golang常用手册之切片(Slice)原理
切片，这是一个在go语言中引入的新的理念。它有一些特征如下：对数组抽象数组长度不固定可追加元素切片容量可增大容量大小成片增加我们先把上面的理念整理在这
100 行代码透彻解析 RPC 原理
文章来源：https://sourl.cn/HpZHvy 引言本文主要论述的是“RPC 实现原理”，那么首先明确一个问题什么是 RPC 呢？RPC 是 Remote Procedure Call
原理：WebMvcConfigurer 与 WebMvcConfigurationSupport避坑指南
源码地址（包含所有与springmvc相关的，静态文件路径设置，request请求入参接受，返回值处理converter设置等等）： spring-framework/WebMvcConfigurat
java - 关于简单java类中的依赖注入(inject)原理
请通过简单的java类向我展示一个依赖注入(inject)原理的小例子虽然我已经了解了spring，但是如果我需要用简单的java类术语来解释它，那么你能通过一个简单的例子向我展示一下吗？提前致谢。
简单聊聊内网穿透（背景-概念-原理-工具对比）
1、背景我们平常使用手机和电脑上网，需要访问公网上的网络资源，如逛淘宝和刷视频，那么手机和电脑是怎么知道去哪里去拿到这个网络资源来下载到本地的呢？就比如我去食堂拿吃的，我需要
来，今天飞哥带你理解 Iptables 原理！
大家好，我是飞哥! 现在 iptables 这个工具的应用似乎是越来越广了。不仅仅是在传统的防火墙、NAT 等功能出现，在今天流行的的 Docker、Kubernets、Istio 项目中也经
CesiumJS 2022^ 原理[5] - 着色器相关的封装设计
本篇涉及到的所有接口在公开文档中均无，需要下载 GitHub 上的源码，自己创建私有类的文档。 npm run generateDocumentation -- --private yarn gene
solid-principles - SOLID 原理，以及类内的硬编码配置
我最近在很多代码中注意到人们将硬编码的配置(如端口号等)值放在类/方法的深处，使其难以找到，也无法配置。这是否违反了 SOLID 原则？如果不是，我是否可以向我的团队成员引用另一个“原则”来说明为什
mvvm - 命令和 MVVM 原理 - RelayCommands
我是 C#、WPF 和 MVVM 模式的新手。很抱歉这篇很长的帖子，我试图设定我所有的理解点(或不理解点)。在研究了很多关于 WPF 提供的命令机制和 MVVM 模式的文本之后，我在弄清楚如何使用这
javascript - Angularjs $http.post 原理
可比较的 jQuery 函数 $.post("/example/handler", {foo: 1, bar: 2}); 将创建一个带有 post 参数 foo=1&bar=2 的请求。鉴于 $htt
Django "lazy query execution"原理
如果Django不使用“延迟查询执行”原则，主要问题是什么？ q = Entry.objects.filter(headline__startswith="What") q = q.filter(
c# - .NET 中的 BODMAS 原理
我今天发现.NET框架在做计算时遵循BODMAS操作顺序。即计算按以下顺序进行: 括号订单部门乘法添加减法但是我四处搜索并找不到任何文档确认 .NET 绝对遵循此原则，是否有此类文档？如
c++ - 库方便使用 "design by contract"原理
已结束。此问题不符合 Stack Overflow guidelines .它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题，以便用事实和引用来回答它。关闭
CesiumJS 2022^ 原理[4] - 最复杂的地球皮肤影像与地形的渲染与下载过程
API 回顾在创建 Viewer 时可以直接指定影像供给器（ImageryProvider），官方提供了一个非常简单的例子，即离屏例子（搜 offline）： new Cesium.Viewer(
compiler-construction - self 学习编译器的最佳方法:原理，技术和工具
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be

首页

博学

6Ren·AI

商城

从原理聊JVM（五）：JVM的编译过程和优化手段

1、前端编译

1 准备

2 解析与填充符号表

3 注解处理器

4 分析与字节码生成

4.1 标注检查

4.2 数据及控制流分析

4.3 解语法糖

4.4 字节码生成

2、运行时编译

1 使用编译执行的时机

2 编译模式

2.1 Client compiler

2.1.1 方法内联

2.1.2 去虚拟化

2.1.3 冗余消除

2.2 Server complier

2.2.1 标量替换

2.2.2 栈上分配

2.2.3 同步削除

2.3 OSR（On Stack Replace，栈上替换）

首页

博学

6Ren·AI

商城

从原理聊JVM（五）：JVM的编译过程和优化手段

﻿1、前端编译

1 准备

2 解析与填充符号表

3 注解处理器

4 分析与字节码生成

4.1 标注检查

4.2 数据及控制流分析

4.3 解语法糖

4.4 字节码生成

2、运行时编译

1 使用编译执行的时机

2 编译模式

2.1 Client compiler

2.1.1 方法内联

2.1.2 去虚拟化

2.1.3 冗余消除

2.2 Server complier

2.2.1 标量替换

2.2.2 栈上分配

2.2.3 同步削除

2.3 OSR（On Stack Replace，栈上替换）

1、前端编译