JVM（2）——GC算法和收集器

一、引入

上篇博客《JVM——简介》中主要介绍了JVM的内存模型，思考一下：

为什么要划分堆、栈、方法区等？

为什么把不同种类的数据信息分别存放？

答案可以分为很多很多条，这里就说一个方面，如果我们是如何区分数据的种类的，那就是作用域。比如：堆、方法区是线程共享的，而栈是私有的。

那么管理又包括哪些方面呢？包括创建、存储、回收？这篇博客就来谈谈垃圾回收（Garbage Collection）。

小编建议各位读者把自己当成GC，那个以回收垃圾为工作的人，这么说貌似有点……

二、算法

问自己三个问题：

what——回收什么

how——怎么回收

when——什么时候回收

1、What

作为GC，我们要回收些什么？对象实例、变量、类型信息……你怎么知道哪些要回收哪些不需要回收呢，是不是还应用该对象实例，这个对象死了吗？

判断一个对象死了吗，听着很简单，做起来就不是那么一回事了。

1）计数器

给每个对象实例绑一个计数器，如果有人引用他，就加1，不再引用之后，就减1。那么当值为0时，应该就是不被使用的了。

实现简单，效率也高，但解决不了循环引用的问题。即A引用B，B引用A，按照这种思路，他们就要永久的绑在一起了。

2）引用链

假定有一个Root节点，作为起始点，向下搜索，当某个对象没有在这条链上时，即他怎么都走不到Root的时候，我们就说他是不再使用的，可以被回收。

懒得画了，从网上找了个图。

2、How

1）标记-清除

两个阶段：先标记，后统一回收。

这个办法很简单很基础，但真的是不怎么看好。时间上，两个过程效率都不高；空间上，会产生大量的空闲碎片，不利于再次使用。

那怎么办？看后面的方法对他进行改进。

2）复制

主要解决效率问题。

先将内存划分相同大小的两块区域，只使用其中一块。当这一块内存用完了，将对象拷贝到没使用的那块内存区域上，然后进行清理。

不足之处很明显了，内存很宝贵的呀！！！这简直是复制算法的致命伤，

提出这个观点的估计是个没受过穷的富家公子啊。

3）标记-整理

主要解决了内存碎片问题。

他的过程前半部分跟标记-清除一样，就在清理之后，让还活着对象移动到一端，把碎片问题解决了。

当然，效率肯定没有标记-清除好了，不过平衡了一下，这个算法还不错。

3、When

GC不能精准的控制回收的具体时间，但分代收集可以控制到一个回收的频率。

言归正传，文章最开始说到了堆和栈中存放的数据作用域（生命周期）是不同的，那么他们的回收频率肯定不一样。其实实际上要更复杂一点，堆内部的对象实例存活的时间也各有不同，如果每次回收都扫描一遍，那效率是十分低下的。基于这一点，引出著名的分代收集的算法。

分代收集

大致分为三个年代：新生代、老年代和永久代。新生代中又分出两个区域：S0（Survivor0）、S1（Survivor1）。个别名字可能翻译的不同，理解就好。

新生代

Eden：伊甸园的意思，这里一般存储新创建的对象。这些对象有两种结局，要么被收集清理掉，要么移到下一个Survivor Space中。

Survivor：幸存者，大致是说他们已经死里逃生一次了。

老年代

Old Space：在新生代中对象达到一定比例后，就会将多余的对象移入老年代。

永久代

前面两种都是存放在堆中的，因此，又可以把老年代看作是新生代的“备用仓库”。而永久代是在方法区中的，回收频率是最慢的。

各个年代有各个年代的特点，他们也就可以选择适合自己的算法来进行回收。新生代每次回收的数量都很大，可以使用复制算法。老年代对象存活的时间长，空间也不大，就只能使用“标记-清理”或者“标记-整理”了。

分代收集算法其实还是利用How中的几个基本算法，只是划分区域（年代），更科学的使用收集算法。

三、收集器

前面解决了垃圾回收的what、how、when的问题，那么就要开始实打实的干活了！谁去干？怎么干呢？

收集器就是帮助我们去解决这个问题的，每个特点也是不一样的，在单独介绍之前，我们先来分分类。

标准	收集器
年代	新生代、老年代
工作模式	串行、并行、并发
碎片处理	压缩、非压缩
……	……

没有最好的收集器，也没有万能的收集器，只有挑选更适合的才是科学的。

1）Serial

adj.

1. 连续的；一连串的；一系列的。

2.按期出版的；(小说等)连载的；连续刊行的；连续广播的。

3.分期偿付的。

4.【计算机】中行的；串联的。

特点：

简单；

单线程；

新生代。

2）ParNew

Serial的多线程版本；

新生代；

3）Parallel Scavenge

Parallel

adj.

1.平行的；并行的 (to; with); 【电学】并联的。

2.同一方向的，同一目的的。

3.相同的，同样的，相似的，对应的。

新生代；

并行；

重视吞吐量（这个后面说）。

4）CMS

Concurrent Low Pause Collector 并发低停顿收集器

重视停顿时间，响应速度快，带给用户良好体验。

过程比较复杂，篇幅有限，不再介绍了。

5）G1

并发；

分代收集；

标记-整理；

降低停顿时间。