正文

Java 语言的 3 类编译器:

  • 前端编译器:把 java 文件 转变成 class 文件。例如:Sun 的 Javac。
  • JIT 编译器(即时编译器):后端运行期编译器,把字节码转变成机器码。例如:HotSpot VM 的 C1、C2 编译器。
  • AOT 编译器(静态提前编译器):直接把 java 文件编译成本地机器代码。例如:GCJ(GNU Compiler for the Java)。

Java 语言的“编译期”是一段“不确定”的操作过程,它可能是 3 类编译器中某类的编译过程。

一、Javac 编译器

Javac 的编译过程大致可分为 3 个过程:

  • 解析与填充符号表过程。
  • 插入式注解处理器的注解处理过程。
  • 分析与字节码生成过程。

这 3 个步骤之间的关系与交互顺序如下图所示:

Javac 的编译动作入口是 com.sun.tools.javac.main.JavaCompiler 类,上述 3 个过程的代码逻辑集中在这个类的 compile() 和 compile2() 方法中。

1、解析与填充符号表

(1)词法、语法分析

词法分析是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程的最小元素,而标记则是编译过程的最小元素,关键字、变量名、字面量、运算符都可以成为标记。

语法分析是根据 Token 序列构造抽象语法树的过程。

抽象语法树(AST)是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构,例如包、类型、修饰符、运算符、接口、返回值甚至代码注释等都可以是一个语法结构。生成抽象语法树之后,编译器的后续操作基本都建立在抽象语法树之上。

在 Javac 源码中,词法分析过程由 com.sun.tools.javac.parser.Scanner 类实现,语法分析过程则由 com.sun.tools.javac.parser.Parser 类实现,生成的抽象语法树由 com.sun.tools.javac.tree.JCTree 类表示。

(2)填充符号表

符号表是由一组符号地址和符号信息构成的表格,可以把它想象成哈希表中 K-V 值对的形式。符号表中所登记的信息在编译的不同阶段都要用到。

在 Javac 源码中,填充符号表的过程由 com.sun.tools.javac.comp.Enter 类实现。

2、注解处理

JDK1.6 提供了一组插入式注解处理器的标准 API,在编译期间对注解进行处理。可以把这组 API 看做是一组编译器的插件,在这些插件里面,可以读取、修改、添加抽象语法树中的任何元素。

如果这些插件在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有再对语法树进行修改为止。

在 Javac 源码中,插入式注解处理的初始化过程是在 initProcessAnnotations() 方法中完成的,它的执行过程则是在 processAnnotations() 方法中完成的。

3、语义分析与字节码生成

语法分析之后,编译器获得了程序代码的抽象语法树表示,语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的。

语义分析的主要任务就是对结构上正确的源程序进行上下文逻辑审查,包括标注检查、数据及控制流分析两个步骤。

(1)标注检查

标注检查的内容包括变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。

常量折叠:

标注检查会将表达式的结果值在语法树上标注出来,这个动作称为常量折叠。

比如定义了一个 int a = 1 + 2;。在语法树上仍然能看到字面量“1”、“2”以及操作符“+”,但是经过常量折叠后,会被折叠为字面量“3”,并且会在语法树上标注出来。

在 Javac 源码中,标注检查的入口是 attribute() 方法,具体操作由 com.sun.tools.javac.comp.Attr 类和 com.sun.tools.javac.comp.Check类完成。

(2)数据及控制流分析

数据及控制流分析是对程序上下文逻辑更进一步的验证,包括局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理等。

编译期的数据及控制流分析与类加载时的数据及控制流分析的目的基本上是一致的,只是检验范围有所区别,有一些校验项只有在编译期或运行期才能进行。

在 Javac 源码中,数据及控制流分析的入口是 flow() 方法,具体操作由 com.sun.tools.javac.comp.Flow类完成。

(3)解语法糖

语法糖是指在计算机语言中添加的某种语法,这种语法对语言的功能没有影响,但是能够方便程序员使用,增加程序的可读性,从而减少程序代码出错的机会。

虚拟机运行时并不支持语法糖的语法,因此,需要在编译阶段还原回简单的基础语法结构,这个过程称为解语法糖。

在 Javac 源码中,解语法糖的过程由 desugar() 方法触发,在 com.sun.tools.javac.comp.TransTypes 类和 com.sun.tools.javac.comp.Lower 类中完成。

(4)字节码生成

字节码生成是 Javac 编译过程的最后一个阶段,在 Javac 源码中由 com.sun.tools.javac.jvm.Gen 类完成。

字节码生成阶段不仅仅是把前面各个步骤所生成的信息(语法树、符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。例如,实例构造器 init() 方法和类构造器 clinit() 方法就是在这个阶段添加到语法树之中的。

完成了对语法树的遍历和调整之后,会把填充了所有所需信息的符号表交给 com.sun.tools.javac.jvm.ClassWriter 类,由这个类的 writeClass() 方法输出字节码,生成最终的 class 文件。

二、Java 语法糖的味道

1、泛型与类型擦除

泛型的本质是参数化类型的应用,即将所操作的数据类型指定为一个参数。这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口和泛型方法。

C# 与 Java 的泛型:

泛型技术在 C# 和 Java 之中的使用方式看似相同,但实现上却有着根本性的分歧。

C# 的泛型无论在程序源码中、编译后的 IL (中间语言,这时候泛型是一个占位符)中,或是运行期的 CLR(公共语言运行库) 中,都是切实存在的。在 C# 中,List 与 List 就是两个不同的类型,它们在系统运行期生成,有自己的虚方法表和数据类型,这种实现称为类型膨胀,基于这种方法实现的泛型称为真实泛型

Java 的泛型只在程序源码中存在,在编译后的字节码文件中,就已经替换为原来的原生类型(也称为裸类型)了,并且在相应的地方插入了强制转型代码。因此,对于运行期的 Java 语言来说,ArrayList 与 ArrayList 就是同一个类,所以泛型技术实际上是 Java 语言的一颗语法糖,Java 语言中的泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型

2、自动装箱与拆箱、遍历循环、变长参数

自动装箱与拆箱在编译之后被转化成了对应的包装和还原方法。比如 Integer.valueOf() 与 Integer.intValue()。

遍历循环把代码还原成了迭代器的实现,这也是为何遍历循环需要被遍历的类实现 Iterable 接口的原因。

变长参数在调用的时候变成了一个数组类型的参数。

3、条件编译

条件编译是指编译器在编译时只对满足条件的代码进行编译,而将不满足条件的代码舍弃。

Java 语言可以使用条件为布尔常量值的 if 语句进行条件编译。根据布尔常量值的真假,编译器会舍弃分支中不成立的代码块。

《深入理解 Java 虚拟机》读书笔记:早期(编译期)优化的更多相关文章

  1. 深入理解Java虚拟机 -- 读书笔记(1):JVM运行时数据区域

    深入理解Java虚拟机 -- 读书笔记:JVM运行时数据区域 本文转载:http://blog.csdn.net/jubincn/article/details/8607790 本系列为<深入理 ...

  2. 【Todo】深入理解Java虚拟机 读书笔记

    有一个在线系列地址 <深入理解Java虚拟机:JVM高级特性与最佳实践(第2版)> http://book.2cto.com/201306/25426.html 已经下载了这本书(60多M ...

  3. 深入理解Java虚拟机读书笔记6----早期(编译期)优化

    六 早期(编译期)优化   1 “编译期”的含义     · 可能是指一个前端编译器把*.java文件转变成*.class文件的过程,前端编译器如:Sun的Javac.Eclipse JDT中的增量式 ...

  4. 深入理解Java虚拟机读书笔记5----虚拟机字节码执行引擎

    五 虚拟机字节码执行引擎   1 运行时栈帧结构     ---栈帧是用于支持虚拟机进行方法调用和方法执行的数据结构,是虚拟机运行时数据区中的虚拟机栈的栈元素.     ---栈帧中存储了方法的局部变 ...

  5. 深入理解Java虚拟机读书笔记7----晚期(运行期)优化

    七 晚期(运行期)优化 1 即时编译器(JIT编译器)     ---当虚拟机发现某个方法或代码块的运行特别频繁时,就会把这些代码认定为“热点代码”,包括被多次调用的方法和被多次执行的循环体.     ...

  6. 深入理解Java虚拟机读书笔记4----虚拟机类加载机制

    四 虚拟机类加载机制 1 类加载机制     ---概念:虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验.转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型.     -- ...

  7. 深入理解Java虚拟机读书笔记3----类文件结构

    三 类文件结构 1 Java虚拟机的两种中立特性     · 平台无关性     · 语言无关性     实现平台无关性和语言无关性的基础是虚拟机和字节码存储格式(Class文件).   2 Clas ...

  8. 深入理解Java虚拟机读书笔记1----Java内存区域与HotSpot虚拟机对象

    一 Java内存区域与HotSpot虚拟机对象 1 Java技术体系.JDK.JRE?     Java技术体系包括:         · Java程序设计语言:         · 各种硬件平台上的 ...

  9. 深入理解java虚拟机读书笔记1--java内存区域

    Java在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域.这些区域都有各自的用途.创建和销毁的时间,有一些是随虚拟机的启动而创建,随虚拟机的退出而销毁,有些则是与线程一一对应,随 ...

  10. 深入理解java虚拟机---读书笔记

    第一章 走近java 1. java 技术体系: java 程序设计语言 各种硬件平台上的java虚拟机 class 文件格式 java API 类库 来自商业机构或者开源机构的第三方java类库 j ...

随机推荐

  1. 查看github仓库的地址

  2. ContentType明细对照表(文件类型相关的设置)

    文件扩展名 Content-Type(Mime-Type) 文件扩展名 Content-Type(Mime-Type) .*( 二进制流,不知道下载文件类型) application/octet-st ...

  3. js中对Object对象的一些常用操作总结

    前言我前面的文章,写过js中“类”与继承的一些文章.ES5我们可以通过 构造函数 或者 Object.create()等方式来模拟出js中的“类”,当然,对象呢是类的实例化,我们可以通过如下方式创建对 ...

  4. HexoC++第04课 构造析构.md

    C++第04课 构造析构.mdhtml {overflow-x: initial !important;}#write, body { height: auto; } #write, #write h ...

  5. Scrapy初体验(一) 环境部署

    系统选择centOs 7,Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中. 其最初是为了 页面抓取 (更确切来说, ...

  6. ERROR: Error in Log_event::read_log_event(): 'Found invalid event in binary log', data_len: 31, event_type: 35报错处理

    centos7系统MySQL5.7在用mysqlbinlog命令查询binlog日志时刚开始查询即自动终止查询,查了一下该日志有300M,于是仔细看发现有报错,见下图: 在网上查找经验贴http:// ...

  7. Redis报错Can't save in background: fork: Cannot allocate memory及类似问题的处理方法

    问题的发现及解决过程: 1.Redis主从复制(一主一从)环境在客户端用命令查看主从状态 在slave上输入命令显示如下: 在master上输入命令显示如下: 从显示可以看出主从关系出现问题,然后查看 ...

  8. Linux IO多路复用

    监听文件描述符的状态来进行相应的读写操作,3个函数: 123 selectpollepoll 123456789 int (int nfds, fd_set *readfds, fd_set *wri ...

  9. RocketMQ 零拷贝

    一.零拷贝原理:Consumer 消费消息过程,使用了零拷贝,零拷贝包含以下两种方式: 1.使用 mmap + write 方式  (RocketMQ选择的方式:因为有小块数据传输的需求,效果会比 s ...

  10. Design Patterns 25

    尽管将一个系统分割成许多对象通常可以增加其可服用性, 但是对象间相互连接的激增又会降低其可复用性了. 大量的连接使得一个对象不可能在没有改变其他对象的支持下工作, 系统表现为一个不可分割的整体, 所以 ...