正文

Java 语言的 3 类编译器:

  • 前端编译器:把 java 文件 转变成 class 文件。例如:Sun 的 Javac。
  • JIT 编译器(即时编译器):后端运行期编译器,把字节码转变成机器码。例如:HotSpot VM 的 C1、C2 编译器。
  • AOT 编译器(静态提前编译器):直接把 java 文件编译成本地机器代码。例如:GCJ(GNU Compiler for the Java)。

Java 语言的“编译期”是一段“不确定”的操作过程,它可能是 3 类编译器中某类的编译过程。

一、Javac 编译器

Javac 的编译过程大致可分为 3 个过程:

  • 解析与填充符号表过程。
  • 插入式注解处理器的注解处理过程。
  • 分析与字节码生成过程。

这 3 个步骤之间的关系与交互顺序如下图所示:

Javac 的编译动作入口是 com.sun.tools.javac.main.JavaCompiler 类,上述 3 个过程的代码逻辑集中在这个类的 compile() 和 compile2() 方法中。

1、解析与填充符号表

(1)词法、语法分析

词法分析是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程的最小元素,而标记则是编译过程的最小元素,关键字、变量名、字面量、运算符都可以成为标记。

语法分析是根据 Token 序列构造抽象语法树的过程。

抽象语法树(AST)是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构,例如包、类型、修饰符、运算符、接口、返回值甚至代码注释等都可以是一个语法结构。生成抽象语法树之后,编译器的后续操作基本都建立在抽象语法树之上。

在 Javac 源码中,词法分析过程由 com.sun.tools.javac.parser.Scanner 类实现,语法分析过程则由 com.sun.tools.javac.parser.Parser 类实现,生成的抽象语法树由 com.sun.tools.javac.tree.JCTree 类表示。

(2)填充符号表

符号表是由一组符号地址和符号信息构成的表格,可以把它想象成哈希表中 K-V 值对的形式。符号表中所登记的信息在编译的不同阶段都要用到。

在 Javac 源码中,填充符号表的过程由 com.sun.tools.javac.comp.Enter 类实现。

2、注解处理

JDK1.6 提供了一组插入式注解处理器的标准 API,在编译期间对注解进行处理。可以把这组 API 看做是一组编译器的插件,在这些插件里面,可以读取、修改、添加抽象语法树中的任何元素。

如果这些插件在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有再对语法树进行修改为止。

在 Javac 源码中,插入式注解处理的初始化过程是在 initProcessAnnotations() 方法中完成的,它的执行过程则是在 processAnnotations() 方法中完成的。

3、语义分析与字节码生成

语法分析之后,编译器获得了程序代码的抽象语法树表示,语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的。

语义分析的主要任务就是对结构上正确的源程序进行上下文逻辑审查,包括标注检查、数据及控制流分析两个步骤。

(1)标注检查

标注检查的内容包括变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。

常量折叠:

标注检查会将表达式的结果值在语法树上标注出来,这个动作称为常量折叠。

比如定义了一个 int a = 1 + 2;。在语法树上仍然能看到字面量“1”、“2”以及操作符“+”,但是经过常量折叠后,会被折叠为字面量“3”,并且会在语法树上标注出来。

在 Javac 源码中,标注检查的入口是 attribute() 方法,具体操作由 com.sun.tools.javac.comp.Attr 类和 com.sun.tools.javac.comp.Check类完成。

(2)数据及控制流分析

数据及控制流分析是对程序上下文逻辑更进一步的验证,包括局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理等。

编译期的数据及控制流分析与类加载时的数据及控制流分析的目的基本上是一致的,只是检验范围有所区别,有一些校验项只有在编译期或运行期才能进行。

在 Javac 源码中,数据及控制流分析的入口是 flow() 方法,具体操作由 com.sun.tools.javac.comp.Flow类完成。

(3)解语法糖

语法糖是指在计算机语言中添加的某种语法,这种语法对语言的功能没有影响,但是能够方便程序员使用,增加程序的可读性,从而减少程序代码出错的机会。

虚拟机运行时并不支持语法糖的语法,因此,需要在编译阶段还原回简单的基础语法结构,这个过程称为解语法糖。

在 Javac 源码中,解语法糖的过程由 desugar() 方法触发,在 com.sun.tools.javac.comp.TransTypes 类和 com.sun.tools.javac.comp.Lower 类中完成。

(4)字节码生成

字节码生成是 Javac 编译过程的最后一个阶段,在 Javac 源码中由 com.sun.tools.javac.jvm.Gen 类完成。

字节码生成阶段不仅仅是把前面各个步骤所生成的信息(语法树、符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。例如,实例构造器 init() 方法和类构造器 clinit() 方法就是在这个阶段添加到语法树之中的。

完成了对语法树的遍历和调整之后,会把填充了所有所需信息的符号表交给 com.sun.tools.javac.jvm.ClassWriter 类,由这个类的 writeClass() 方法输出字节码,生成最终的 class 文件。

二、Java 语法糖的味道

1、泛型与类型擦除

泛型的本质是参数化类型的应用,即将所操作的数据类型指定为一个参数。这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口和泛型方法。

C# 与 Java 的泛型:

泛型技术在 C# 和 Java 之中的使用方式看似相同,但实现上却有着根本性的分歧。

C# 的泛型无论在程序源码中、编译后的 IL (中间语言,这时候泛型是一个占位符)中,或是运行期的 CLR(公共语言运行库) 中,都是切实存在的。在 C# 中,List 与 List 就是两个不同的类型,它们在系统运行期生成,有自己的虚方法表和数据类型,这种实现称为类型膨胀,基于这种方法实现的泛型称为真实泛型

Java 的泛型只在程序源码中存在,在编译后的字节码文件中,就已经替换为原来的原生类型(也称为裸类型)了,并且在相应的地方插入了强制转型代码。因此,对于运行期的 Java 语言来说,ArrayList 与 ArrayList 就是同一个类,所以泛型技术实际上是 Java 语言的一颗语法糖,Java 语言中的泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型

2、自动装箱与拆箱、遍历循环、变长参数

自动装箱与拆箱在编译之后被转化成了对应的包装和还原方法。比如 Integer.valueOf() 与 Integer.intValue()。

遍历循环把代码还原成了迭代器的实现,这也是为何遍历循环需要被遍历的类实现 Iterable 接口的原因。

变长参数在调用的时候变成了一个数组类型的参数。

3、条件编译

条件编译是指编译器在编译时只对满足条件的代码进行编译,而将不满足条件的代码舍弃。

Java 语言可以使用条件为布尔常量值的 if 语句进行条件编译。根据布尔常量值的真假,编译器会舍弃分支中不成立的代码块。

《深入理解 Java 虚拟机》读书笔记:早期(编译期)优化的更多相关文章

  1. 深入理解Java虚拟机 -- 读书笔记(1):JVM运行时数据区域

    深入理解Java虚拟机 -- 读书笔记:JVM运行时数据区域 本文转载:http://blog.csdn.net/jubincn/article/details/8607790 本系列为<深入理 ...

  2. 【Todo】深入理解Java虚拟机 读书笔记

    有一个在线系列地址 <深入理解Java虚拟机:JVM高级特性与最佳实践(第2版)> http://book.2cto.com/201306/25426.html 已经下载了这本书(60多M ...

  3. 深入理解Java虚拟机读书笔记6----早期(编译期)优化

    六 早期(编译期)优化   1 “编译期”的含义     · 可能是指一个前端编译器把*.java文件转变成*.class文件的过程,前端编译器如:Sun的Javac.Eclipse JDT中的增量式 ...

  4. 深入理解Java虚拟机读书笔记5----虚拟机字节码执行引擎

    五 虚拟机字节码执行引擎   1 运行时栈帧结构     ---栈帧是用于支持虚拟机进行方法调用和方法执行的数据结构,是虚拟机运行时数据区中的虚拟机栈的栈元素.     ---栈帧中存储了方法的局部变 ...

  5. 深入理解Java虚拟机读书笔记7----晚期(运行期)优化

    七 晚期(运行期)优化 1 即时编译器(JIT编译器)     ---当虚拟机发现某个方法或代码块的运行特别频繁时,就会把这些代码认定为“热点代码”,包括被多次调用的方法和被多次执行的循环体.     ...

  6. 深入理解Java虚拟机读书笔记4----虚拟机类加载机制

    四 虚拟机类加载机制 1 类加载机制     ---概念:虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验.转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型.     -- ...

  7. 深入理解Java虚拟机读书笔记3----类文件结构

    三 类文件结构 1 Java虚拟机的两种中立特性     · 平台无关性     · 语言无关性     实现平台无关性和语言无关性的基础是虚拟机和字节码存储格式(Class文件).   2 Clas ...

  8. 深入理解Java虚拟机读书笔记1----Java内存区域与HotSpot虚拟机对象

    一 Java内存区域与HotSpot虚拟机对象 1 Java技术体系.JDK.JRE?     Java技术体系包括:         · Java程序设计语言:         · 各种硬件平台上的 ...

  9. 深入理解java虚拟机读书笔记1--java内存区域

    Java在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域.这些区域都有各自的用途.创建和销毁的时间,有一些是随虚拟机的启动而创建,随虚拟机的退出而销毁,有些则是与线程一一对应,随 ...

  10. 深入理解java虚拟机---读书笔记

    第一章 走近java 1. java 技术体系: java 程序设计语言 各种硬件平台上的java虚拟机 class 文件格式 java API 类库 来自商业机构或者开源机构的第三方java类库 j ...

随机推荐

  1. Web of science|SCIE|影响因子|SSCI|高被引论文|领域中热点论文|

    信息检索: 数据库 Web of science 影响因子只是针对期刊打分,并不是对文章打分.所以对文章评价可以看引用次数. SCIE (Science Citation Index Expanded ...

  2. 吴裕雄--天生自然 R语言开发学习:基本统计分析(续三)

    #---------------------------------------------------------------------# # R in Action (2nd ed): Chap ...

  3. C++二级指针和指针引用传参

    前提 一级指针和引用 已经清晰一级指针和引用. 可参考:指针和引用与及指针常量和常量指针 或查阅其他资料. 一级指针和二级指针 个人觉得文字描述比较难读懂,直接看代码运行结果分析好些,如果想看文字分析 ...

  4. 淘宝网-接口测试白皮书V0.1

    <软件自动化测试开发> 出版了 淘宝(中国)软件有限公司 接口测试白皮书   V0.1 淘宝网平台测试组(qa.taobao.com) 淘宝网-接口测试白皮书 2 目录 1  接口测试的背 ...

  5. 自研接口测试平台(Django2+Bootstrap3+Unittest)

    自研接口测试平台(Django2+Bootstrap3+Unittest) HttpRuleTest是一款面向 HTTP 协议的通用测试框架,只需web端维护接口测试数据,即可实现自动化测试.监控.数 ...

  6. 手工创建 efi,msr 分区 · Virgil Chan

    昨天在帮同学装 win10 的时候,不小心(不知道那是什么东西)把原系统的 efi 和 msr 盘删了,用 WinNTsetup 安装时 EFI PART 总显示红叉,安装后也进不去系统,想想应该是找 ...

  7. Hexo搭建个人博客(一)— 前期准备

    最近几个月自学python的过程中,搜索爬虫资料的时候关注了xlzd的博客,为我开启了一片新世界,之后慢慢收藏了各方高人的博客.搭建一个自己博客的萌芽也悄然种下,也许是命运使然,在逛知乎的时候偶然间看 ...

  8. Python——7列表生成式

    */ * Copyright (c) 2016,烟台大学计算机与控制工程学院 * All rights reserved. * 文件名:text.cpp * 作者:常轩 * 微信公众号:Worldhe ...

  9. C#使用正则表达式获取HTML代码中a标签里包含指定后缀的href的值

    //C#使用正则表达式获取HTML代码中a标签里包含指定后缀的href的值,表达式如下: Regex regImg = new Regex(@"(?is)<a[^>]*?href ...

  10. jenkins-设置定时任务

    前言 跑自动化用例每次用手工点击 jenkins 出发自动化用例太麻烦了,我们希望能每天固定时间 跑,这样就不用管了,坐等收测试报告结果就行. 一.定时构建语法  * * * * * (五颗星,中间用 ...