所有的垃圾回收器的目的都是朝着减少STW的目的而前进，G1(Garbage First)回收器的出现颠覆了之前版本CMS、Parallel等垃圾回收器的分代收集方式，从2004年Sun发布第一篇关于G1的论文后，直到2012年JDK7发布更新版本，花了将近10年的时间G1才达到商用的程度，而到JDK9发布之后，G1成为了默认的垃圾回收器，CMS也变相地相当于被淘汰了。

G1结构

G1抛弃了之前的分代收集的方式，面向整个堆内存进行回收，把内存划分为多个大小相等的独立区域Region。

一共有4种Region：

自由分区Free Region
年轻代分区Young Region，年轻代还是会存在Eden和Survivor的区分
老年代分区Old Region
大对象分区Humongous Region

每个Region的大小通过-XX:G1HeapRegionSize来设置，大小为1~32MB，默认最多可以有2048个Region，那么按照默认值计算G1能管理的最大内存就是32MB*2048=64G。

对于大对象的存储，存在Humongous概念，对G1来说，超过一个Region一半大小的对象都被认为大对象，将会被放入Humongous Region，而对于超过整个Region的大对象，则用几个连续的Humongous来存储（如下图H区域）。

G1优势

上面我们也提到，垃圾回收器的最终目的都是为了减少STW造成的停顿，比如之前老的垃圾回收器CMS这种带来的停顿时间是不可预估的。

而G1最大的优势就在于可预测的停顿时间模型，我们可以自己通过参数-XX:MaxGCPauseMillis来设置允许的停顿时间(默认200ms)，G1会收集每个Region的回收之后的空间大小、回收需要的时间，根据评估得到的价值，在后台维护一个优先级列表，然后基于我们设置的停顿时间优先回收价值收益最大的Region。

那么，这个可预测的停顿时间模型怎么计算和建立的？主要是基于衰减平均值的理论基础，衰减平均是一种数学方法，用来计算一个数列的平均值，给近期的数据更高的权重，强调近期数据对结果的影响，代码如下：

hotspot/src/share/vm/gc_implementation/g1/g1CollectorPolicy.hpp
double get_new_prediction(TruncatedSeq* seq) {
  return MAX2(seq->davg() + sigma() * seq->dsd(),
              seq->davg() * confidence_factor(seq->num()));
}

davg表示衰减值

sigma表示一个系数，代表信贷度，默认值为0.5

dsd表示衰减标准偏差

confidence_factor表示可信度系数，用于当样本数据不足(小于5个)时取一个大于1的值，样本数据越少该值越大。

基于这个模型，G1希望根据用户设置的停顿时间（只是期望时间，尽量努力在这个范围内完成GC）来选择需要对哪些Region进行回收，能回收多大空间。

比如过去10次回收10G内存花费1s，如果预设的停顿时间是200ms，那么就最多可以回收2G的内存空间。

空间分配&扩展

既然G1还是存在新生代和老年代的概念，那么新生代和老年代的空间是怎么划分的呢？

在G1中，新增了两个参数G1MaxNewSizePercent、G1NewSizePercent，用来控制新生代的大小，默认的情况下G1NewSizePercent为5，也就是占整个堆空间的5%，G1MaxNewSizePercent默认为60，也就是堆空间的60%。

假设现在我们的堆空间大小是4G，按照默认最大2048个Region计算，每个Region的大小就是2M。

初始新生代的大小那么就是200M，大约100个Region格子，动态扩展最大就是60%*4G=2.4G大小。

不过显然，事情不是这么简单，实际上初始化新生代的空间大小逻辑还是挺复杂的。

首先，我们通过原有参数-Xms设置初始堆的大小，-Xmx设置最大堆的大小还是生效的，可以设置堆的大小。

可以通过原有参数-Xmn或者新的参数G1NewSizePercent、G1MaxNewSizePercent来设置年轻代的大小，如果设置了-Xmn相当于设置G1NewSizePercent=G1MaxNewSizePercent。
接着看是不是设置了-XX:NewRatio(表示年轻代与老年代比值，默认值为2，代表年轻代老年代大小为1:2)，如果1都设置了，那么忽略NewRatio，反之则代表G1NewSizePercent=G1MaxNewSizePercent，并且分配规则还是按照NewRatio的规则。
如果只是设置了G1NewSizePercent、G1MaxNewSizePercent中的一个，那么就按照这两个参数的默认值5%和60%来设置。
如果设置了-XX:SurvivorRatio，默认为8，那么Eden和Survivor还是按照这个比例来分配

按照这个规则，我们新生代和老年代的空间分配基本就完成，如果说新生代走默认的规则，每次动态扩展空间大小怎么办？

有一个参数叫做-XX:GCTimeRatio表示GC时间与应用耗费时间比，默认为9，就是说GC时间和应用时间占比超过10%才进行扩展，扩展比例为20%，最小不能小于1M。

回收过程

G1的回收过程分为以下四个步骤：

初始标记：标记GC ROOT能关联到的对象，需要STW
并发标记：从GCRoots的直接关联对象开始遍历整个对象图的过程，扫描完成后还会重新处理并发标记过程中产生变动的对象
最终标记：短暂暂停用户线程，再处理一次，需要STW
筛选回收：更新Region的统计数据，对每个Region的回收价值和成本排序，根据用户设置的停顿时间制定回收计划。再把需要回收的Region中存活对象复制到空的Region，同时清理旧的Region。需要STW。

总的来说这是一个偏向记忆的回收过程，知道就行了。

相对于之前我们存在分代概念的GC来说，G1其实也是类似的过程，总体可以分为这两种：

年轻代GC，年轻代Region在超过我们默认设置的最大大小之后就会触发GC，还是用的我们熟悉的复制算法，Eden和Survivor来回倒腾，这里不再赘述。
Mixed GC混合回收，混合回收类似于之前我们的Full GC概念，既会回收年轻代的Region，也会回收老年代的Region，还有我们新的Humongous大对象区域。触发规则根据参数-XX:InitiatingHeapOccupancyPercent(默认45%)值，也就是说老年代Region达到整个堆内存的45%时触发Mixed GC。

其他问题

上面应该把基本概念都解释完了。

比如什么是G1？G1有什么特点？他的优点是什么？划分Region后怎么分配空间？怎么进行垃圾回收？什么时候进行YGC？什么时候进行FGC？可靠的停顿时间模型建立方式？

除此之外，其实还有一些较为复杂的问题，比如之前我们说分代收集有跨代引用的问题，划分Region之后应该也有对不对，那怎么解决的？

还有之前我们说并发收集阶段怎么解决用户线程和收集线程互不干扰的？

这些更深一点的问题其实在现在已经卷到需要问三色标记了吗？已经说到了很多了，下面我们再详细点说明下在G1中的一些不同点。

记忆集

在这篇文章中我们提到过一次关于Remembered Set的概念，为了避免GC时扫描整个堆内存，用来标志哪些区域存在跨代引用，对于G1来说也一样，只不过G1的记忆集会更复杂一点。

每个Region中都存在一个Hash Table结构的记忆集，Key为其他Region的起始地址，Value是其他Card Table卡表的索引集合。

原来我们的卡表指向的是卡页的内存地址段，代表我引用了谁，现在的记忆集则是代表着谁引用了我，因此收集的过程会更复杂一点，并且需要额外的10%~20%的堆内存空间来维持。

维护记忆集的方式也和卡表类似，通过写屏障来实现。

原始快照SATB

在三色标记中我们也提到过，并发标记用户线程和收集线程一起工作会产生问题，解决方案CMS使用的是增量更新，G1则是用原始快照。

总结

写这些东西比较费劲，因为总在想在理解的基础上怎么写的更通俗易懂，但是发现好像并不容易，因为自己也都是看完没过多久就忘记了，所以记录下来，能看懂就行了，实在不行就去看书。

周老师的深入Java虚拟机写的比较简单，很多东西要去搜资料和书结合看才能看明白，另外一本书写的也不是很好，作者感觉只是堆砌知识点，看起来很费劲，美团写的那篇文章也是一大堆名词，不知道的人看的简直蛋疼。

我应该，比他们写的更通俗一点就好了？

参考：

彭成寒《JVM G1源码分析和调优》

周志明《深入理解Java虚拟机第三版》

美团：Java Hotspot G1 GC的一些关键技术

不管卷不卷，面试还是得问问你G1原理！的更多相关文章

GNU/Linux下LVM配置管理以及快照卷、物理卷、卷组、逻辑卷的创建和删除
LVM是Linux环境中对磁盘分区进行管理的一种机制,是建立在硬盘和分区之上.文件系统之下的一个逻辑层,可提高磁盘分区管理的灵活性.最大的优点是在不损伤数据的前提下调整存储空间的大小. 本篇主要讲述L ...
烂泥：LVM学习之逻辑卷、卷组及物理卷删除
本文由秀依林枫提供友情赞助,首发于烂泥行天下. 上篇文章,我们介绍了有关LVM的逻辑卷及卷组的空间缩小.这次我们来介绍下如何删除一个逻辑卷及卷组. 删除逻辑卷需要以下几个步骤: 1. 卸载已经挂载的逻 ...
烂泥：LVM学习之逻辑卷及卷组缩小空间
本文由秀依林枫提供友情赞助,首发于烂泥行天下. 上一篇文章,我们学习了如何给LVM的逻辑卷及卷组扩容.这篇文章我们来学习,如何给LVM的逻辑卷及卷组缩小空间. 注意逻辑卷的缩小一定要离线操作,不能是在 ...
Docker数据管理(数据卷&数据卷容器)
生产环境中使用Docker的过程中,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享,这必然涉及容器的数据管理操作. 容器中管理数据主要有两种方式: 数据卷(Data Volumes):容 ...
linux LVM：物理卷逻辑卷
逻辑卷管理器,当分区不够用的时候,可以新建一个更大的分区再复制进去,但是浪费时间.Lvm可以弹性调整分区大小,可以动态组合分区.分区大小固定了就无法调整, apt-get update & a ...
linux 分区物理卷逻辑卷
今天我们主要说说分区.格式化.SWAP.LVM.软件RAID的创建哈~ 格式化查看当前分区:fdisk -l 这个命令我们以前是讲过的,我现在问下,ID那项是什么意思? 83 是代表EXT2和E ...
Linux 分区初始化为物理卷，把物理卷加入卷组
用到的命令有 1.pvcreate (physical volume create) 2.vgcreate (volume group create) 例子1:创建物理卷 pvcreate /dev/ ...
Unix网络编程_卷1卷2
1. UNIX 网络编程(第2版)第1卷:套接口API和X/Open 传输接口API PDFhttp://www.linuxidc.com/Linux/2014-04/100155.htm UNIX网 ...
实例解析Docker数据卷+数据卷容器+flocker数据共享+DockerHub操作
Docker内部数据管理和Docker之间的数据共享为数据卷和数据卷容器,实例解析1.将本地的文件作为容器的数据卷,2.数据卷flocker插件实现容器集群(或者Docker Swarm)的数据共享3 ...

随机推荐

IntelliJ IDEA 老司机，还没用过 Stream Trace 功能？
前言自从 Java 8 开始,作为程序员的我们都离不开 Stream 相关功能的使用,书写起来那叫一个流畅(这个 feel--).但总是有一些时候,我们对 stream 的操作所要的结果和预期不符, ...
虚拟机快速下载安装配置aarch64-linux-gnu-gcc工具链
方式一:软件仓库安装此方法不用自己去配置交叉编译工具链 1.查看本地仓库有支持哪些版本哪些输入命令: apt-cache search aarch64 2.下载安装 gcc-8-aarch64-l ...
ES6学习-3 const
const声明一个只读的常量.一旦声明,常量的值就不能改变,所以在声名时就进行赋值. const的作用域与let命令相同,只在声明所在的块级作用域内有效. const命令声明的常量,同样存在暂时性死区 ...
Spring Cloud Alibaba Nacos Config 实战
Nacos 提供用于存储配置和其他元数据的 key/value 存储,为分布式系统中的外部化配置提供服务器端和客户端支持.使用 Spring Cloud Alibaba Nacos Config,您可 ...
064.Python开发虚拟环境
在使用 Python 开发的过程中,工程一多,难免会碰到不同的工程依赖不同版本的库的问题:亦或者是在开发过程中不想让物理环境里充斥各种各样的库,引发未来的依赖灾难.此时,我们需要对于不同的工程使用不同 ...
Centos7环境初始化
最近在做公司的一个环境搭建的任务的时候,要用到三台Centos7服务器,在上面要预装java1.8,docker,zookeeper并且要在docker中跑一个mysql,还要部署其他的软件.由于不是 ...
关于STM32的可编程电压检测器的使用方法
关于STM32的可编程电压检测器的使用方法思维导图总览: 代码: 1 #include "sys.h" 2 #include "delay.h" 3 #inc ...
STM32 中的CEC
http://www.cnblogs.com/qdrs/articles/7645117.html
rpm命令的简介（2）-(转自青春乐园 )
青春乐园怎样查看rpm安装包的安装路径 rpm -qpl xxxxxx.rpm 1.如何安装rpm软件包 rmp软件包的安装可以使用程序rpm来完成.执行下面的命令 rpm -i your-pack ...
6.3-4 zip、unzip
zip:打包和压缩文件 zip压缩格式是Windows与Linux等多平台通用的压缩格式.和gzip命令相比,zip命令压缩文件不仅不会删除源文件,而且还可以压缩目录. zip命令的参数选 ...

不管卷不卷，面试还是得问问你G1原理！