HotSpot的对象模型(5)
Java对象通过Oop来表示。Oop指的是 Ordinary Object Pointer(普通对象指针)。在 Java 创建对象实例的时候创建,用于表示对象的实例信息。也就是说,在 Java 应用程序运行中每创建一个 Java 对象,在 JVM 内部都会创建一个 Oop 对象来表示 Java 对象。
Oop涉及到的相关类的继承关系如下图所示。

1、oopDesc类
oopDesc的一个别名为oop,所以HotSpot中一般会使用oop来表示oopDesc类型。
oopDesc 是 所 有 的 类 名 为 xxxOopDesc 格 式 的 类 的 基 类 , 这 些 类 的 实 例 表 示 Java 对 象,所以xxxOopDesc 格式的类中会声明一些保存 Java 对象的字段,并且也可以直接被 C++获取。类及重要属性的定义如下:
位置:/openjdk/hotspot/src/share/vm/oops/oop.hpp
class oopDesc {
...
private:
volatile markOop _mark;
union _metadata {
Klass* _klass;
narrowKlass _compressed_klass;
} _metadata;
...
}
Java对象内存布局主要分为header(头部)和fields(实例字段)。header由_mark和_metadata组成。_mark字段保存了Java对象的一些信息,如GC年龄,锁状态等;_metadata使用联合体(union)来声明 ,这样是为了在 64 位机器上能对指针进行压缩。因为从32位平台到64位时,主要就是指针由4字节变为了8字节,所以通常64位HotSpot消耗的内存会比32位的大,造成堆内存损失,不过从JDK 1.6 update14开始,64位的JVM正式支持了-XX:+UseCompressedOops(默认开启)。这个可以压缩指针,起到节约内存占用的作用。
在64位系统下,存放_metadata的空间大小是8字节,_mark是8字节,对象头为16字节。64位开启指针压缩的情况下,存放_metadata的空间大小是4字节,_mark是8字节,对象头为12字节。
启用-XX:+UseCompressedOops命令后,主要会压缩如下的一些对象:
- 每个Class的属性指针(静态成员变量);
- 每个对象的属性指针;
- 普通对象数组的每个元素指针。
当然,压缩也不是所有的指针都会压缩,对一些特殊类型的指针,HotSpot是不会优化的,例如指向Metaspace的Class对象指针、本地变量、堆栈元素、入参、返回值和NULL指针不会被压缩。
64位地址分为堆的基地址+偏移量,当堆内存小于32GB时候,在压缩过程中,把偏移量除以8后的结果保存到32位地址。当解压时再把32位地址放大8倍,所以启用-XX:+UseCompressedOops命令的条件是堆内存要在4GB*8=32GB以内。具体实现方式是在机器码中植入压缩与解压指令,可能会给JVM增加额外的开销。
总结一下:
- 如果GC堆大小在4G以下,直接砍掉高32位,避免了编码解码过程;
- 如果GC堆大小在4G以上32G以下,则启用-XX:+UseCompressedOops命令;
- 如果GC堆大小大于32G,压指失效,使用原来的64位。
联合体中定义的_klass或_compressed_klass指针指向的是Klass实例,这个Klass实例保存了Java对象的实际类型,也就是Java对象所对应的Java类。
调用header_size()函数获取header占用的内存空间的大小,具体实现如下:
位置:/openjdk/hotspot/src/share/vm/oops/oop.inline.hpp
static int header_size() {
return sizeof(oopDesc)/HeapWordSize;
}
计算占用的字的大小,对于64位机器来说,一个字的大小为8字节,所以HeapWordSize的值为8。
Java对象的header信息可以存储到oopDesc类中定义的_mark和_metadata属性上,而Java对象的fields没有在oopDesc类中定义相应的属性来存储,所以只能申请一定大小的空间,然后按顺序进行存储。对象字段是存放在紧跟着oopDesc实例本身占用的内存空间之后的,在获取时只能通过偏移来取值。
opDesc 类的field_base()函数可用于获取字段的地址,实现如下:
位置:/openjdk/hotspot/src/share/vm/oops/oop.inline.hpp
inline void* field_base(int offset) const {
return (void*)&( (char*)this )[offset];
}
offset是偏移量,计算相对于当前实例this的内存首地址的偏移量。
2、markOopDesc类
上面介绍oopDesc类时,可以看到定义了一个属性_mark,而类型为markOop,其实这是markOopDesc的别名。markOopDesc类的实例可以表示Java对象头信息的“Mark Word",包含的信息有哈希码、GC分代年龄、偏向锁标记、线程持有的锁、偏向线程ID、偏向时间戳等。
markOopDesc类的实例并不能表示一个具体的Java对象,而是通过一个字的各个位来表示Java对象的头信息。对于32位系统来说,一个字为32位(4字节),而对于64位系统来说,一个字有64位(8字节)。由于目前64位是主流,所以笔者不在对32位的结构进行说明。
下图表示了在Java对象不同状态下的Mark Word各个位区间的含义。

上面每一行代表对象处于某种状态时的样子。其中各部分的含义如下:
- lock:2位的锁状态标记位,由于希望用尽可能少的二进制位表示尽可能多的信息,所以设置了lock标记。该标记的值不同,整个Mark Word表示的含义不同。biased_lock和lock一起表示了锁的状态。
- biased_lock:对象是否启用偏向锁标记,只占1个二进制位。为1时表示对象启用偏向锁,为0时表示对象没有偏向锁。lock和biased_lock共同表示对象的锁状态。
- age:占用4个二进制位,存储的是Java对象的年龄。在GC中,如果对象在Survivor区复制一次,年龄增加1。当对象达到设定的阈值时,将会晋升到老年代。默认情况下,并行GC的年龄阈值为15,并发GC的年龄阈值为6。由于age只有4位,所以最大值为15,这就是-XX:MaxTenuringThreshold选项最大值为15的原因。
- identity_hashcode:占用31个二进制位,用来存储对象的HashCode,采用延迟加载技术。调用方法System.identityHashCode()计算,并会将结果写到该对象头中。如果当前对象的锁状态为偏向锁,由于偏向锁没有存储HashCode的地方,所以调用identityHashCode()方法会造成锁升级,而轻量级锁和重量级锁所指向的lock record或monitor都有存储HashCode的空间。hashCode 只针对 identity hash code。用户自定义的 hashCode() 方法所返回的值不存在 Mark Word 中。Identity hash code 是未被覆写的 java.lang.Object.hashCode() 或者 java.lang.System.identityHashCode(Object) 所返回的值。
- thread:持有偏向锁的线程ID。
- epoch:偏向锁的时间戳。
- ptr_to_lock_record:轻量级锁状态下,指向栈中锁记录的指针。
- ptr_to_heavyweight_monitor:重量级锁状态下,指向对象监视器Monitor的指针。
关于锁与锁升级相关的内容,后续文章会详细介绍,这里只需要大概认识一下相关的字段即可。
参考文章:
(2)JVM Anatomy Quark #23: Compressed References
HotSpot的对象模型(5)的更多相关文章
- HotSpot的对象模型(6)
接着上一篇,我们继续来讲oopDesc相关的子类. 3.instanceOopDesc类 instanceOopDesc类的实例表示除数组对象外的其它对象.在HotSpot中,对象在内存中存储的布局可 ...
- HotSpot的执行引擎-CallStub栈帧
之前多次提到接触到调用JavaCalls::call()方法来执行Java方法,如: (1)Java主类装载时,调用JavaCalls::call()方法执行的Java方法checkAndLoadMa ...
- Java虚拟机(二)对象的创建与OOP-Klass模型
前言 在前一篇文章中我们学习了Java虚拟机的结构原理与运行时数据区域,那么我们大概知道了Java虚拟机的内存的概况,那么内存中的数据是如何创建和访问的呢?这篇文章会给你答案. 1.对象的创建 对象的 ...
- 操作句柄Handle(7)
可以将Handle理解成访问对象的一个“句柄”.垃圾回收时对象可能被移动(对象地址发生改变),通过Handle访问对象可以对使用者屏蔽垃圾回收细节. Handle涉及到的相关类的继承关系如下图所示. ...
- 句柄Handle的释放(8)
本篇首先介绍几个与句柄分配与释放密切相关的类,然后重点介绍句柄的释放. 1.HandleArea.Area与Chunk 句柄都是在HandleArea中分配并存储的,类的定义如下: // Thread ...
- Java主类的装载
在JavaMain()函数中调用LoadMainClass()函数加载Java主类.LoadMainClass()函数的实现如下: /* * Loads a class and verifies th ...
- 解析Class文件
类文件解析的入口是ClassFileParser类中定义的parseClassFile()方法.上一小节得到了文件字节流stream后,接着会在ClassLoader::load_classfile( ...
- klassVtable与klassItable
klassVtable与klassItable类用来实现Java方法的多态,也可以叫动态绑定,是指在应用执行期间通过判断接受对象的实际类型,根据实际类型调用对应的方法.C++为了实现多态,在对象中嵌入 ...
- 字段解析之OopMapBlock(4)
OopMapBlock是一个简单的内嵌在Klass里面的数据结构,用来描述oop中包含的引用类型属性,即该oop所引用的其他oop在oop中的内存分布,然后就可以根据当前oop的地址找到所有引用的其他 ...
随机推荐
- 随机抽样一致性(RANSAC)算法详解
随机抽样一致性(RANSAC)算法能够有效的剔除特征匹配中的错误匹配点. 实际上,RANSAC能够有效拟合存在噪声模型下的拟合函数.实际上,RANSAC算法的核心在于将点划分为“内点”和“外点”.在一 ...
- Android开发学习笔记Intent 一
Inten的概念 1.Intent是Android四大组件直接沟通的桥梁 2.Intent是一种运行时绑定(runtime binding)机制 Intent对象的属性 Itent的种类 Inten过 ...
- RabbitMQ巩固学习一
说起RabbitMQ大家第一时间应该想到的就是异步队列,关于异步队列的话题简直太多了,各位同学在园子里一搜便知.我第一次听异步队列这个名词感觉非常高大上
- Tensorflow 中(批量)读取数据的案列分析及TFRecord文件的打包与读取
内容概要: 单一数据读取方式: 第一种:slice_input_producer() # 返回值可以直接通过 Session.run([images, labels])查看,且第一个参数必须放在列表中 ...
- Domain Adaptive Faster R-CNN:经典域自适应目标检测算法,解决现实中痛点,代码开源 | CVPR2018
论文从理论的角度出发,对目标检测的域自适应问题进行了深入的研究,基于H-divergence的对抗训练提出了DA Faster R-CNN,从图片级和实例级两种角度进行域对齐,并且加入一致性正则化来学 ...
- 网易java高级开发课程 面对上亿数据量,网易用啥技术?
- LeetCode 80,不使用外部空间的情况下对有序数组去重
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是LeetCode专题的第49篇文章,我们一起来看LeetCode的第80题,有序数组去重II(Remove Duplicates fr ...
- Day11-微信小程序实战-交友小程序-附近的人(地图的形式)及位置获取
回顾:在下面的tabbar中,我们已经实现了首页 消息 我的,就剩下”附近“页面了 ”附近“的页面主要是用地图来进行展示的(可以显示我的位置,也可以显示周围附近的人的位置) (在地图里面点击它的头像的 ...
- Zookeeper分布式过程协同技术 - 部署及设置
Zookeeper分布式过程协同技术 - 部署及设置 Zookeeper支持单机模式.伪集群模式.集群模式三种部署方式.演示部署环境为CentOS.jdk版本为1.8.Zookeeper版本为3.4 ...
- Python 简明教程 --- 13,Python 集合
微信公众号:码农充电站pro 个人主页:https://codeshellme.github.io 如果代码和注释不一致,那很可能两者都错了. -- Norm Schryer 目录 前几节我们已经介绍 ...