小师妹学JVM之:JVM的架构和执行过程
简介
JVM也叫Java Virtual Machine,它是java程序运行的基础,负责将java bytecode转换成为适合在各个不同操作系统中运行的机器代码并运行。今天我们和小师妹一起走进java的核心JVM,领略java在设计上的哲学。
JVM是一种标准
小师妹:F师兄,经常听到有人说hotspot VM,这个跟JVM是什么关系?
其实吧,JVM只是一种标准,就像是一种协议,只要是实现和满足这种协议的都可以称为JVM。当然,java现在是Oracle公司的,所以这些所谓的JVM标准也是由Oracle来颁布的,如果你去查看Oracle的文档,就会发现有一个专门的Java SE Specifications栏目,这个栏目中列出了JVM的实现标准,最新的标准就是The Java Virtual Machine Specification, Java SE 14 Edition。
更多精彩内容且看:
- 区块链从入门到放弃系列教程-涵盖密码学,超级账本,以太坊,Libra,比特币等持续更新
- Spring Boot 2.X系列教程:七天从无到有掌握Spring Boot-持续更新
- Spring 5.X系列教程:满足你对Spring5的一切想象-持续更新
- java程序员从小工到专家成神之路(2020版)-持续更新中,附详细文章教程
更多内容请访问www.flydean.com
既然JVM是一个标准,就可能有很多种实现。各大公司在满足JVM标准的基础上,开发了很多个不同的版本。
下面是我在维基百科中截取到的目前各个JVM的比较:

小师妹:F师兄,大家齐心协力做一个JVM不是更好吗?为什么分来分去的,还要重复造轮子?
有听过Oracle和Google之间的API十年诉讼案吗?API都不能顺便用,更何况是JVM。各大厂商为了各自的利益,最终搞出了这么多个JVM的版本。
在这些JVM中,最常用的就是HotSpot JVM了,毕竟它是Oracle的亲儿子,或者可以说HotSpot JVM就是JVM的标准。
接下来就是Eclipse OpenJ9,这个是由IBM主导的JVM,一般只能跟IBM的产品一起使用的,因为有许可证限制。
java程序的执行顺序
为了说明JVM的作用,我们先来回顾一下java程序的执行顺序。

- 编写java代码文件比如Example.java
- 使用java编译器javac将源文件编译成为Example.class文件
- JVM加载生成的字节码文件,将其转换成为机器可以识别的native machine code执行
JVM的架构
小师妹:F师兄,Java语言那么多特性,最后都要在JVM中运行,JVM的架构是不是特别复杂?好怕我听不懂。
其实吧,JVM可以分为三大部分,五大空间和三大引擎,要讲起来也不是特别复杂,先看下面的总体的JVM架构图。

从上面的图中,我们可以看到JVM中有三大部分,分别是类加载系统,运行时数据区域和Execution Engine。
类加载系统
类加载系统分为三个阶段,分别是加载,链接和初始化。
加载大家都很清楚了,java中有个专门的ClassLoader来负责这个事情。除了加载Class之外,ClassLoader还可以用来加载resources。
在JDK9之前,系统默认有三个类加载器,分别是:
- Bootstrap ClassLoader
这个类加载器主要是加载 /jre/lib下面的rt.jar,并且这个类加载器是用C/C++来编写的,并且它是后面Extension ClassLoader的父ClassLoader。
这个类应该在java代码中找不到的(correct me if I am wrong!)。
- Extension ClassLoader
这个类加载器主要加载JDK的扩展类 /jre/lib/ext,它的实现类是 sun.misc.Launcher$ExtClassLoader :
static class ExtClassLoader extends URLClassLoader {
private static volatile Launcher.ExtClassLoader instance;
public static Launcher.ExtClassLoader getExtClassLoader() throws IOException {
if (instance == null) {
Class var0 = Launcher.ExtClassLoader.class;
synchronized(Launcher.ExtClassLoader.class) {
if (instance == null) {
instance = createExtClassLoader();
}
}
}
return instance;
}
我们看下它的实现,实际上它创建了一个单例模式,使用的是双重检查加锁,小师妹可以考虑一下怎么使用延迟初始化占位类的方式来重新这个类。
- System ClassLoader
这个加载器是加载定义在ClassLoader中的类。它的实现类是sun.misc.Launcher$AppClassLoader,这个类的实现很长,这里就不完整列出来了:
static class AppClassLoader extends URLClassLoader
在JDK9之后,因为引入了JPMS模块的概念,所以类加载器变得不一样了,在JDK9之后还是有三个内置的类加载器,分别是BootClassLoader,PlatformClassLoader和AppClassLoader:
private static class BootClassLoader extends BuiltinClassLoader {
BootClassLoader(URLClassPath bcp) {
super(null, null, bcp);
}
@Override
protected Class<?> loadClassOrNull(String cn, boolean resolve) {
return JLA.findBootstrapClassOrNull(this, cn);
}
};
private static class PlatformClassLoader extends BuiltinClassLoader
private static class AppClassLoader extends BuiltinClassLoader
Linking阶段主要做了三件事情:
- Verification - 主要验证字节码文件的结构的正确性,如果不正确则会报LinkageError。
- Preparation - 负责创建static fields,并且初始化他们的值。
- Resolution - 把类型的常量池中引用的类,接口,字段和方法替换为直接引用的过程。
Initialization阶段主要是调用class的父类和自身的初始化方法,来设置变量的初始值。
运行时数据区域
类加载好了,也初始化了,接下来就可以准备运行了。
运行的时候要为数据分配运行空间,这就是运行时数据区域的作用。
运行时数据区域又可以分为5个部分:
- Method Area
方法区是非Heap的内存空间,主要用来存放class结构,static fields, method, method’s data 和 static fields等。方法区是在JVM启动的时候创建的,并且在所有的线程中共享。
Run-Time Constant Pool运行时常量池是放在方法区中的,他是class文件中constant_pool的运行时表现。
注意在JDK8之前,HotSpot JVM中对方法区的实现叫做持久代Perm Gen。不过在JDK8之后,Perm Gen已经被取消了,现在叫做Metaspace。Metaspace并不在java虚拟机中,它使用的是本地内存。Metaspace可以通过-XX:MaxMetaspaceSize来控制。
- Heap Area
Heap Area主要存储类对象和数组。垃圾回收器(GC)主要就是用来回收Heap Area中的对象的。
- Stack Area
因为是栈的结构,所以这个区域总是LIFO(Last in first out)。我们考虑一个方法的执行,当方法执行的时候,就会在Stack Area中创建一个block,这个block中持有对本地对象和其他对象的引用。一旦方法执行完毕,则这个block就会出栈,供其他方法访问。
- PC Registers
PC Registers主要用来对程序的执行状态进行跟踪,比如保存当前的执行地址,和下一步的地址等。
- Native Methods
最后一个就是本地方法区了,因为JVM的底层很多都是由C/C++来实现的,这些方法的实现就构成了本地方法区。
执行引擎
执行引擎主要负责将java的字节码翻译成机器码然后执行。
先看一个java字节码的内在结构,大家可以随便找一个编译好的类,使用javap来进行解析:
javap -v BufferUsage

这里不过多介绍输出结果的含义,我们会在后面的文章中进行详解。
这我们可以看到方法中都有一个Code片段,这些Code被称为OpCode,是JVM可以理解的操作命令。
执行引擎中里面又有三个部分:
- Interpreter
翻译器用来读取上面介绍的OpCode,并将其翻译成为机器语言。因为翻译器需要一个命令一个命令的翻译字节码,所以速度会比较慢。这就是很久很久以前Java被诟病的地方。
- JIT (Just-In-Time) compiler
为了解决Interpreter翻译慢的问题,JDK引入了JIT,对于那些经常使用的代码,JIT会将这些字节码翻译成为机器代码,并直接复用这些机器代码,从而提高了执行效率。
- Garbage Collector
GC用来回收Heap Area,他是一个Daemon thread。
总结
本文介绍了JVM的总体架构信息。各个部分的细节信息会在后面的系列文章中陆续讲解。欢迎大家关注小师妹系列。
本文作者:flydean程序那些事
本文链接:http://www.flydean.com/jvm-all-in-one/
本文来源:flydean的博客
欢迎关注我的公众号:程序那些事,更多精彩等着您!
小师妹学JVM之:JVM的架构和执行过程的更多相关文章
- 小师妹学JVM之:深入理解JIT和编译优化-你看不懂系列
目录 简介 JIT编译器 Tiered Compilation分层编译 OSR(On-Stack Replacement) Deoptimization 常见的编译优化举例 Inlining内联 Br ...
- 小师妹学JVM之:cache line对代码性能的影响
目录 简介 一个奇怪的现象 两个问题的答案 CPU cache line inc 和 add 总结 简介 读万卷书不如行万里路,讲了这么多assembly和JVM的原理与优化,今天我们来点不一样的实战 ...
- 小师妹学JVM之:JIT中的PrintCompilation
目录 简介 PrintCompilation 分析PrintCompilation的结果 总结 简介 上篇文章我们讲到了JIT中的LogCompilation,将编译的日志都收集起来,存到日志文件里面 ...
- 小师妹学JVM之:java的字节码byte code简介
目录 简介 Byte Code的作用 查看Byte Code字节码 java Byte Code是怎么工作的 总结 简介 Byte Code也叫做字节码,是连接java源代码和JVM的桥梁,源代码编译 ...
- 小师妹学JVM之:JIT中的PrintAssembly
目录 简介 使用PrintAssembly 输出过滤 总结 简介 想不想了解JVM最最底层的运行机制?想不想从本质上理解java代码的执行过程?想不想对你的代码进行进一步的优化和性能提升? 如果你的回 ...
- 小师妹学JVM之:GC的垃圾回收算法
目录 简介 对象的生命周期 垃圾回收算法 Mark and sweep Concurrent mark sweep (CMS) Serial garbage collection Parallel g ...
- 小师妹学JVM之:JDK14中JVM的性能优化
目录 简介 String压缩 分层编译(Tiered Compilation) Code Cache分层 新的JIT编译器Graal 前置编译 压缩对象指针 Zero-Based 压缩指针 Escap ...
- 小师妹学JVM之:JIT中的LogCompilation
目录 简介 LogCompilation简介 LogCompilation的使用 解析LogCompilation文件 总结 简介 我们知道在JVM中为了加快编译速度,引入了JIT即时编译的功能.那么 ...
- 小师妹学JVM之:逃逸分析和TLAB
目录 简介 逃逸分析和栈上分配 TLAB简介 TLAB详解 设置TLAB空间的大小 TLAB中大对象的分配 TLAB空间中的浪费 总结 简介 逃逸分析我们在JDK14中JVM的性能优化一文中已经讲过了 ...
随机推荐
- Spring BeanFactory 容器
Spring 的 BeanFactory 容器 这是一个最简单的容器,它主要的功能是为依赖注入 (DI) 提供支持,这个容器接口在 org.springframework.beans.factory. ...
- .Net基础之5——复杂数据类型
(1)复习 1.变量 int double string char bool decimal 变量的使用规则:先声明再赋值最后使用 2.Camo Pascal 3.运算符 ...
- 统计元音(hdu20)
输入格式:输入一个整型,再循环输入带空格的字符串. 思考:先用scanf()函数输入一个整型,后面直接来个大循环,带空格字符串输入直接用gets()函数. 注意:由于scanf()里面多加了%c,&a ...
- DQN(Deep Q-learning)入门教程(一)之强化学习介绍
什么是强化学习? 强化学习(Reinforcement learning,简称RL)是和监督学习,非监督学习并列的第三种机器学习方法,如下图示: 首先让我们举一个小时候的例子: 你现在在家,有两个动作 ...
- 干货!JNPF快速开发平台功能一览
JNPF,采用主流的两大技术Java/.Net开发,是一套低代码开发平台,可视化开发环境,有拖拽式的代码生成器,灵活的权限配置.SaaS服务,强大的接口对接,随心可变的工作流引擎,一站式开发多端使 ...
- MySQL的CHAR 和 VARCHAR的区别
CHAR 和 VARCHAR 类型,CHAR 列的长度固定, VARCHAR 列中的值为可变长字符串.在检索的时候,CHAR 列删除了尾部的空格,而 VARCHAR 则保留这些空格s
- oracle 11g 用户名和密码默认区分大小写
oracle 11g 用户名和密码默认区分大小写,可更改alter system set sec_case_sensitive_logon=false 设置改为不区分大小写.
- 哥德巴赫猜想 Java实现
1.接口实现 package goldbach; /** * 输入一个大于6的偶数,请输出这个偶数能被分解为哪两个质数的和.如:10=3+7 12=5+7 * 此为按接口实现类完成 * * @auth ...
- 【HTTP】Web服务器和HTTP的协作&HTTP首部
用单台虚拟主机实现多个域名 Web服务器可以搭建多个独立域名的Web网站,也可以作为通信路径上的中转服务器提升效率. HTTP/1.1规范允许一台HTTP服务器搭建多个Web站点,提供Web托管服务的 ...
- [批处理教程之Shell]002.Linux 常用命令大全
这一次收集的是比较基础的 Linux 命令,其实 Linux 命令未必每个都要记住,只要在用到时能查阅到需要的命令的用法. 系统信息 *.显示机器的处理器架构(1)arch *.显示机器的处理器架构( ...