七年开发经验详解JVM的GC 算法
概述
GC 是 JVM 自带的功能,它能够自动回收对象,清理内存,这是 Java 语言的一大优势,但是GC绝不仅伴随着Java,相反,GC历史比Java更悠久。关于GC,我认为有四个问题需要解决:
- 为什么了解 GC?
- 哪些内存需要回收?
- 什么时候回收?
- 如何回收?
为什么了解 GC
GC 已经比较成熟,绝大部分情况下都“自动化”运行。之所以还需要了解GC,是因为当需要排查各种内存溢出、内存泄露问题时,当垃圾收集成为系统达到更高并发量的瓶颈时,我们就需要对这些“自动化”的技术实施必要的监控和调节。
哪些内存需要回收
判定哪些内存需要回收,不是靠 JVM 去猜,也不是随机,而是 JVM 靠一系列算法得到结果,当然,算法也是人写的,虽然不能做到百分之百地符合所有开发者的要求,但这已经是最好的了。下面介绍一种判定内存回收的算法——可达性分析算法,这是我暂时能理解的算法。
可达性分析算法
这个算法的基本思路是通过一系列的称为 “GC Roots” 的对象作为起点,从这些起点开始向下搜索,搜索走过的路径称为引用链,当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是不可用的,也就是待回收的。例如,上图中的 Object 5、Object 6 虽然两者相互关联,但是它们任何一个都和 GC Roots 不可达,所以 Object 5 和 Object 6 将会被判定为可回收的对象。
GC Roots
至于什么是 GC Roots 对象,解释如下:
- 虚拟机栈(栈帧中的本地变量表)引用的对象
- 方法区中类静态变量引用的对象
- 方法区中常量引用的对象
- 本地方法栈 JNI 引用的变量
什么时候回收
当通过“可达性分析”等算法标记好需要回收的对象后,等待它们的不是即可问斩,而是宣告“缓刑”。最后的回收条件是此对象是否有必要执行 finalize() 方法。
finalize() 方法
当对象没有覆盖 finalize() 方法,或者 finalize() 方法已经被虚拟机调用过,虚拟机都将视作“没有必要执行”。如果这个对象呗判定为有必要执行 finalize() 方法,那么这个对象将会放置在一个叫作 F-Queue 的队列中,这个队列在后期会被某个JVM自动创建的线程执行,如果一个对象在finalize()方法中执行缓慢或者发生了死循环,将可能导致 F-Queue 队列中其他对象永久处于等待状态,甚至导致整个内存回收系统崩溃,幸运的是任何一个对象的 finalize() 方法只会被系统调用一次。
在 《深入理解 JVM 虚拟机》中,作者建议尽量避免使用 finalize() 方法,它不是c++ 中的析构函数,更像是java为适应c++程序员而作出的让步。我觉得是finalize()方法是一根鸡肋,一根如果运用不当将会引发灾难的鸡肋,如同 goto 语句。它的运行代价极高,不确定性大,无法保证各个对象的调用顺序。它的功能经常会被误以为类似 try-finally,然而 finalize() 能做的工作, try-finally 都能做,而且做得更好、更及时。
如何回收
标记-清楚法
“标记-清除”(Mark-Sweep)法是最基础的收集算法。算法分为两个阶段——“标记”和“清除”:首先标记出所有需要被回收的对象,在标记完成后统一回收所有标记了的对象,图如篇首。
它有两个不足之处:
- 效率不高
- 标记和清除两个过程的效率都不高
- 产生大量不连续碎片
- 虽然对象被回收,但是剩下的内存很有可能不连续,在这种情况下,当需要为系统分配一个较大对象时,会因为无法找到足够的连续的内存而不得不提前触发另一次垃圾收集动作。这样,又会造成效率问题
针对上述两个缺点,后面两种算法对此进行了改进。
复制法
“复制”(Copying)是为了解决“标记-清除”的效率不高问题而被发明。它将内存按容量划分为等量的两块。每次只使用其中的一块。当使用的这一块内存用完了,就将还存活的对象复制到另一块(被称作“保留区”)上面,然后再把已使用的内存空间一次清理掉。每次都对整个半区进行回收,再也不用担心内存碎片化问题,图如下所示。
但是“复制”法也有缺点,每次都将内存缩小为一半,会导致内存利用率不高。并且在对象存活率高时进行复制操作,效率就会变低(因为存活的对象要复制到“保留区”)。当遇上极端情况,对象存活率百分百(以原内存一半为单位),那就需要另外的百分之五十的空间作为分配担保。
标记-整理法
“标记-整理”(Mark-Compact)法适合对象存活率高的情况使用。“标记”过程同“标记-清除”法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存,图如下所示:
分代收集法
据知,当前商业虚拟机都采用“分代收集”(Generational Collection)法,根据对象的存活周期的不同将内存划分为几块。一般是把 Java 堆分成新生代和老年代,这样可以根据更年代的特点采用最适当的收集算法。
新生代
在新生代中,每次垃圾收集时都会发现有大量对象死去,只有少量存活,那就选用复制算法,只需要复制少量的对象就可以完成收集,成本小。
老年代
老年代中的对象存活率高、没有额外的空间对它进行分配担保,就必须使用“标记-清除”、和“标记-整理”法来进行回收。
写在最后:欢迎留言讨论,加关注,持续更新!!!
七年开发经验详解JVM的GC 算法的更多相关文章
- Java虚拟机详解----JVM常见问题总结
[声明] 欢迎转载,但请保留文章原始出处→_→ 生命壹号:http://www.cnblogs.com/smyhvae/ 文章来源:http://www.cnblogs.com/smyhvae/p/4 ...
- Java 详解 JVM 工作原理和流程
Java 详解 JVM 工作原理和流程 作为一名Java使用者,掌握JVM的体系结构也是必须的.说起Java,人们首先想到的是Java编程语言,然而事实上,Java是一种技术,它由四方面组成:Java ...
- ISO七层模型详解
ISO七层模型详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 在我刚刚接触运维这个行业的时候,去面试时总是会做一些面试题,笔试题就是看一个运维工程师的专业技能的掌握情况,这个很 ...
- UWP入门(七)--SplitView详解与页面跳转
原文:UWP入门(七)--SplitView详解与页面跳转 官方文档,逼着自己用英文看,UWP开发离不开官方文档 1. SplitView 拆分视图控件 拆分视图控件具有一个可展开/可折叠的窗格和一个 ...
- 【模型推理】量化实现分享一:详解 min-max 对称量化算法实现
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本文剖析一下 m ...
- 【模型推理】量化实现分享二:详解 KL 对称量化算法实现
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本文剖析一下 K ...
- 【模型推理】量化实现分享三:详解 ACIQ 对称量化算法实现
欢迎关注我的公众号 [极智视界],回复001获取Google编程规范 O_o >_< o_O O_o ~_~ o_O 大家好,我是极智视界,本文剖析一下AC ...
- [转帖]详解JVM内存布局及GC原理,值得收藏
概述 https://www.toutiao.com/i6731345429574713868/ java发展历史上出现过很多垃圾回收器,各有各的适应场景,不仅仅是开发,作为运维也需要对这方面有一定的 ...
- Java虚拟机详解----JVM内存结构
http://www.cnblogs.com/smyhvae/p/4748392.htm 主要内容如下: JVM启动流程 JVM基本结构 内存模型 编译和解释运行的概念 一.JVM启动流程: JVM启 ...
随机推荐
- get请求utf-8解码
package utils;import java.io.UnsupportedEncodingException;import java.net.URLDecoder; /*** <p> ...
- Windows 下使用OpenSSL生成RSA公钥和私钥
Windows 下使用OpenSSL生成RSA公钥和私钥 (1)下载OpenSSL 可到该地址下载OpenSSL: https://www.openssl.org/source/(https://ww ...
- python 判断文件是否存在和删除文件的api (其中判断文件在不在让想起这个可以强兼容jenkins工作目录那个问题)
判断文件在不在的api: os即operating system(操作系统),Python 的 os 模块封装了常见的文件和目录操作. os.path模块主要用于文件的属性获取,exists是“存在” ...
- python学习:python打包成exe
1) 安装pyinstaller pip install pyinstaller 目前已经支持 python 3.7 版本 2) 打开cmd窗口,进入到要打包的python文件所在目录, pyinst ...
- Delphi中进行延时的4种方法
1.挂起,不占CPUsleep2.不挂起,占cpuprocedure Delay(msecs:integer);varFirstTickCount:longint;beginFirstTickCou ...
- Nginx配置自定义的403页面
1.开启nginx的状态码,虚拟主机配置中加入下边一段 location /nginx_status{ stub_status on; access_log off; } 或着在nginx的http模 ...
- git的使用学习(四)git的远程仓库
1.远程仓库介绍 到目前为止,我们已经掌握了如何在Git仓库里对一个文件进行时光穿梭,你再也不用担心文件备份或者丢失的问题了. 可是有用过集中式版本控制系统SVN的童鞋会站出来说,这些功能在SVN里早 ...
- 实验1 C 语言开发环境使用和数据类型、运算符、表达式
# include <stdio.h> int main() { int x; printf("x:\n"); scanf("%d",&x) ...
- fastai 2019 part1 数据集分享
链接:https://pan.baidu.com/s/1UuQ8gJ2qXLvPK2rdIqWCMQ 提取码:ghn9
- [转帖]K8s 工程师必懂的 10 种 Ingress 控制器
K8s 工程师必懂的 10 种 Ingress 控制器 https://www.kubernetes.org.cn/5948.html 控制器有好多啊. 2019-10-18 23:07 中文社区 分 ...