JVM内核-原理、诊断与优化学习笔记(五):GC参数
文章目录
堆的回顾
串行收集器
- 最古老,最稳定
- 效率高
- 可能会产生较长的停顿(因为只有一个线程)
-XX:+UseSerialGC
新生代、老年代使用串行回收
新生代复制算法
老年代标记-压缩
GC关键字:新生代gc日志
0.844: [GC 0.844: [DefNew: 17472K->2176K(19648K), 0.0188339 secs] 17472K->2375K(63360K),
0.0189186 secs] [Times: user=0.01 sys=0.00, real=0.02 secs]
Full GC关键字:老年代gc日志
8.259: [Full GC 8.259: [Tenured: 43711K->40302K(43712K), 0.2960477 secs] 63350K->40302K(63360K),
[Perm : 17836K->17836K(32768K)], 0.2961554 secs] [Times: user=0.28 sys=0.02, real=0.30 secs]
并行收集器
ParNew(par-并行的缩写,new-新生代,所以只是新生代并行)
- -XX:+UseParNewGC
新生代并行
老年代串行 - Serial收集器新生代的并行版本
- 复制算法
- 多线程,需要多核支持
- -XX:ParallelGCThreads 限制线程数量
和串行收集器的区别是,通过多核支持多线程。
多线程不一定快哦!
如果是多核用ParNew速度快一点,如果是单线程的话,还是建议串行收集器。
0.834: [GC 0.834: [ParNew: 13184K->1600K(14784K), 0.0092203 secs] 13184K->1921K(63936K),
0.0093401 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
注意:有ParNew关键字表示ParNew收集器
Parallel收集器
- 类似ParNew
- 新生代复制算法
- 老年代 标记-压缩
- 更加关注吞吐量(和ParNew时候的区别)
- -XX:+UseParallelGC
使用Parallel收集器+ 老年代串行+新生代并行 - -XX:+UseParallelOldGC
使用Parallel收集器+ 并行老年代+新生代并行
1.500: [Full GC [PSYoungGen: 2682K->0K(19136K)] [ParOldGen: 28035K->30437K(43712K)] 30717K->30437K(62848K)
[PSPermGen: 10943K->10928K(32768K)],
0.2902791 secs] [Times: user=1.44 sys=0.03, real=0.30 secs]
注意:PSYoungGen 、ParOldGen关键字
参数设置
-XX:MaxGCPauseMills
最大停顿时间,单位毫秒
GC尽力保证回收时间不超过设定值
-XX:GCTimeRatio
0-100的取值范围
垃圾收集时间占总时间的比
默认99,即最大允许1%时间做GC
这两个参数是矛盾的。因为停顿时间和吞吐量不可能同时调优。
对于这句话的理解:
在gc的时候,垃圾回收的工作总量是一定的,所以就是花一定的时间做一定的事情,如果gc的频率提高,每次gc花的时间就会变少,可是系统的性能会受到损伤,就会导致停顿的时间比较短,可是总体的性能并不是很好。但是,为了追求高性能,gc少做几次,也就是XX:GCTimeRatio比值会比较大,gc时间较少,所以每次的gc停顿的时间就会比较长。
吞吐量:一般认为系统的性能是和吞吐量息息相关的,单位时间内cpu是分配到了应用程序还是gc,如果cpu是分配到应用程序越多,吞吐量越高。
吞吐量高->gc占用cpu时间短->gc停顿的时间长。
这里既希望gc的停顿时间短一点,又希望吞吐量大一点,所以是矛盾的,所以不能同时调优,所以有侧重的调优。
CMS收集器
CMS收集器
Concurrent Mark Sweep 并发标记清除( 与用户线程一起执行 )
试图和应用程序线程一起执行。
标记-清除算法
与标记-压缩相比(因为是并行的,所以不能使标记-压缩的方式)
并发阶段会降低吞吐量(停顿减少了,吞吐量就会降低)
老年代收集器(新生代使用ParNew,这里CMS是一个单纯的老年代的收集器)
-XX:+UseConcMarkSweepGC
CMS运行过程比较复杂,着重实现了标记的过程,可分为
- 初始标记
根可以直接关联到的对象
速度快
会产生全局停顿 - 并发标记(和用户线程一起)
主要标记过程,标记全部对象 - 重新标记
由于并发标记时,用户线程依然运行,因此在正式清理前,再做修正
会产生全局停顿 - 并发清除(和用户线程一起)
基于标记结果,直接清理对象
可以看到初始标记、重新标记都会产生全局的停顿,所以CMS还是没有办法去掉所有的全局停顿,但是已经大大的减小了全局停顿。
1.662: [GC [1 CMS-initial-mark: 28122K(49152K)] 29959K(63936K), 0.0046877 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
1.666: [CMS-concurrent-mark-start]
1.699: [CMS-concurrent-mark: 0.033/0.033 secs] [Times: user=0.25 sys=0.00, real=0.03 secs]
1.699: [CMS-concurrent-preclean-start]
1.700: [CMS-concurrent-preclean: 0.000/0.000 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
1.700: [GC[YG occupancy: 1837 K (14784 K)]1.700: [Rescan (parallel) , 0.0009330 secs]1.701: [weak refs processing, 0.0000180 secs] [1 CMS-remark: 28122K(49152K)] 29959K(63936K), 0.0010248 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
1.702: [CMS-concurrent-sweep-start]
1.739: [CMS-concurrent-sweep: 0.035/0.037 secs] [Times: user=0.11 sys=0.02, real=0.05 secs]
1.739: [CMS-concurrent-reset-start]
1.741: [CMS-concurrent-reset: 0.001/0.001 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
关键字:
CMS-initial-mark
CMS-concurrent-mark
CMS-remark
CMS-concurrent-sweep
CMS-concurrent-reset
特点
- 尽可能降低停顿
- 会影响系统整体吞吐量和性能
比如,在用户线程运行过程中,分一半CPU去做GC,系统性能在GC阶段,反应速度就下降一半 - 清理不彻底
因为在清理阶段,用户线程还在运行,会产生新的垃圾,无法清理 - 因为和用户线程一起运行,不能在空间快满时再清理
如果是串行清理、并行清理,gc的时候会停顿,gc完成之后有足够的空间来申请,但是CMS是和应用程序同时进行的,当空间快满时没有足够的空间供申请。
-XX:CMSInitiatingOccupancyFraction设置触发GC的阈值
如果不幸内存预留空间不够,就会引起concurrent mode failure
33.348: [Full GC 33.348: [CMS33.357: [CMS-concurrent-sweep: 0.035/0.036 secs] [Times: user=0.11 sys=0.03, real=0.03 secs]
(concurrent mode failure): 47066K->39901K(49152K),
0.3896802 secs] 60771K->39901K(63936K), [CMS Perm : 22529K->22529K(32768K)],
0.3897989 secs] [Times: user=0.39 sys=0.00, real=0.39 secs]
上面出现concurrent mode failure错误,表示在CMS的时候,内存申请失败。
使用串行收集器作为后备,及时将CMS收集转化为串行收集,但是因为出现这个错误说明内存已经到了消耗殆尽的状态,所以切换为串行收集的时候可能会出现长时间的停顿。
有关碎片
标记-清除和标记-压缩
上图可以看到,标记清除之后会出现碎片,如果要申请五个连续单位的空间,是申请不到的,而标记压缩清理之后是能够申请到,所以串行收集和并行收集都是标记压缩的,而标记清理算法之后一般对剩余的空间一般还要进行一次压缩。
可是为什么CMS是使用的标记清除?因为希望和用户线程同时进行,标记压缩在清理的时候需要移动可用的对象的空间,应用层的线程可能找不到对象在哪里,为了能够和应用程序并发执行, 就需要可用的对象位置是没有改变的。
所以出现如下的配置:
-XX:+ UseCMSCompactAtFullCollection
Full GC后,进行一次整理
整理过程是独占的,会引起停顿时间变长
-XX:+CMSFullGCsBeforeCompaction
设置进行几次Full GC后,进行一次碎片整理,当碎片很多的时候,还是会停顿很长的时间,所以不能从根本上解决问题。
-XX:ParallelCMSThreads
设定CMS的线程数量,一般约等于CPU的数量。
GC参数整理
-XX:+UseSerialGC:在新生代和老年代使用串行收集器
-XX:SurvivorRatio:设置eden区大小和survivior区大小的比例
-XX:NewRatio:新生代和老年代的比
-XX:+UseParNewGC:在新生代使用并行收集器
-XX:+UseParallelGC :新生代使用并行回收收集器
-XX:+UseParallelOldGC:老年代使用并行回收收集器
-XX:ParallelGCThreads:设置用于垃圾回收的线程数
-XX:+UseConcMarkSweepGC:新生代使用并行收集器,老年代使用CMS+串行收集器
-XX:ParallelCMSThreads:设定CMS的线程数量
-XX:CMSInitiatingOccupancyFraction:设置CMS收集器在老年代空间被使用多少后触发
-XX:+UseCMSCompactAtFullCollection:设置CMS收集器在完成垃圾收集后是否要进行一次内存碎片的整理
-XX:CMSFullGCsBeforeCompaction:设定进行多少次CMS垃圾回收后,进行一次内存压缩
-XX:+CMSClassUnloadingEnabled:允许对类元数据进行回收
-XX:CMSInitiatingPermOccupancyFraction:当永久区占用率达到这一百分比时,启动CMS回收
-XX:UseCMSInitiatingOccupancyOnly:表示只在到达阀值的时候,才进行CMS回收
Tomcat实例演示
环境
Tomcat 7
JSP 网站
测试网站吞吐量和延时
工具
JMeter
目的
让Tomcat有一个不错的吞吐量
系统结构
通过局域网连接,将JMeter和Tomcat放在两个电脑上,防止Jmeter对Tomcat的运行产生影响
Jmeter
性能测试工具
建立10个线程,每个线程请求Tomcat 1000次 共10000次请求
设置ip、端口、请求地址。
JDK6:使用32M堆处理请求
参数:
set CATALINA_OPTS=-server -Xloggc:gc.log -XX:+PrintGCDetails -Xmx32M -Xms32M
-XX:+HeapDumpOnOutOfMemoryError -XX:+UseSerialGC -XX:PermSize=32M
Average:在一万次请求中平均的返回速度是6毫秒,
Median:一半的请求都能在4毫秒内返回
90%line:90%请求在7毫秒返回,
min:最小延时2毫秒
max:最大演示135毫秒
Throughput:540每秒()吞吐量
上述截图显示的是,系统运行到后期大量的请求,占据了一些内存,从而会导致系统产生大量的full gc,在32-33秒之间就产生了四次full gc。
JDK6:使用最大堆512M堆处理请求,未设置Xms
为了有更好的性能,最简单的方法就是直接增大堆的数量。
参数:
set CATALINA_OPTS=-Xmx512m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails
结果:FULL GC很少,基本上是Minor GC
吞吐量变成了651,因为没有设置最小初始化堆的大小,所以最小初始化堆就变成了可以扩展的空间,在系统运行时,系统只有16m的内存,但是系统运行到后面,内存在不停的往上涨,到达了60m,整个过程中没有full gc的产生,因为没有full gc的产生,所以吞吐量有一个很好的效果。
JDK6:使用最大堆512M堆处理请求,设置Xms为64m
上面看到最后会扩展到60m,这里直接将Xms设置为64m。
参数:
set CATALINA_OPTS=-Xmx512m -Xms64m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails
结果 GC数量减少 大部分是Minor GC
因为堆越大gc越少,如果堆很小的话,系统希望将工作维持在一个很小的堆上做,必然会不断的进行gc。
JDK6:使用最大堆512M堆处理请求,改为并行收集器
参数:
set CATALINA_OPTS=-Xmx512m -Xms64m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails -XX:+UseParallelGC -XX:+UseParallelOldGC -XX:ParallelGCThreads=4
将新生代和年老代换成并行回收的方式,因为堆很大,所以GC压力原本就不大。
结果:GC压力原本不大,修改GC方式影响很小
JDK 6,减小堆,串行收集器
set CATALINA_OPTS=-Xmx40m -Xms40m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails
减小堆大小,增加GC压力,使用Serial回收器,Serial回收器是默认的回收器。
JDK 6,减小堆,并行收集器
set CATALINA_OPTS=-Xmx40m -Xms40m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails -XX:+UseParallelOldGC -XX:ParallelGCThreads=4
减小堆大小,增加GC压力,使用并行回收器
JDK 6,减小堆,ParNew收集器
set CATALINA_OPTS=-Xmx40m -Xms40m -XX:MaxPermSize=32M -Xloggc:gc.log -XX:+PrintGCDetails -XX:+UseParNewGC
减小堆大小,增加GC压力,使用ParNew回收器
ParNew只是影响新生代,对老年代影响不大,而这里的压力主要是老年代,所以影响不大。
启动Tomcat 7
使用JDK6
不加任何参数启动测试
启动Tomcat 7
使用JDK7
不加任何参数启动测试
可以看到JDK7性能更加好一点。
升级JDK可能会带来额外的性能提升!
不要忽视JDK的版本哦
总结
细节决定成败
- 性能的根本在应用
- GC参数属于微调
- 设置不合理,会影响性能,产生大的延时
JVM内核-原理、诊断与优化学习笔记(五):GC参数的更多相关文章
- 深入JVM内核---原理,诊断与优化
JVM的概念 JAM是Java Virtual Machine的简称.意为Java虚拟机 虚拟机 指通过软件模拟的具有完整硬件系统功能的,运行在一种完整隔离环境中的完整计算机系统 有哪些虚拟机 - V ...
- JVM内核-原理、诊断与优化学习笔记(八):JAVA堆分析
文章目录 内存溢出(OOM)的原因 在JVM中,有哪些内存区间? 堆溢出 永久区 Java栈溢出 直接内存溢出 小问题? MAT使用基础 柱状图显示 支配树 显示线程信息 显示堆总体信息,比如消耗最大 ...
- JVM内核-原理、诊断与优化学习笔记(七):性能监控工具
文章目录 系统性能监控 系统性能监控- linux uptime top vmstat(虚拟内存统计) pidstat 系统性能监控 - windows 任务管理器 Perfmon Process E ...
- JVM内核-原理、诊断与优化学习笔记(四):GC算法与种类
文章目录 GC的概念 GC算法 引用计数法 引用计数法的问题 标记清除 标记压缩 小问题 复制算法 复制算法的最大问题是:空间浪费 整合标记清理思想 -XX:+PrintGCDetails的输出 gc ...
- JVM内核-原理、诊断与优化学习笔记(三):常用JVM配置参数
文章目录 Trace跟踪参数 -verbose:gc (打开gc的跟踪情况) -XX:+printGC(打开gc的log开关,如果在运行的过程中出现了gc,就会打印出相关的信息.) -XX:+Prin ...
- JVM内核-原理、诊断与优化学习笔记(二):JVM运行机制
文章目录 JVM启动流程 PC寄存器 方法区 保存装载的类信息 通常和永久区(Perm)关联在一起 Java堆 Java栈 Java栈 – 局部变量表 ** 包含参数和局部变量 ** Java栈 – ...
- JVM内核-原理、诊断与优化学习笔记(六):类装载器
文章目录 class装载验证流程 class装载验证流程 class装载验证流程 -加载 class装载验证流程 -链接 验证 链接 -> 验证 文件格式的验证 元数据验证(class文件简单语 ...
- JVM内核-原理、诊断与优化学习笔记(一):初识JVM
文章目录 JVM的概念 JVM是Java Virtual Machine的简称.意为Java虚拟机 虚拟机 有哪些虚拟机 VMWare或者Visual Box都是使用软件模拟物理CPU的指令集 JVM ...
- JVM内核-原理、诊断与优化学习笔记(十一):JVM字节码执行
文章目录 javap javap 举个
- JVM内核-原理、诊断与优化学习笔记(十):Class文件结构
文章目录 语言无关性 文件结构 魔数 版本 常量池 CONSTANT_Utf8 CONSTANT_Integer CONSTANT_String CONSTANT_NameAndType CONSTA ...
随机推荐
- 【原理】RabbitMQ架构图
Broker:它提供一种传输服务,它的角色就是维护一条从生产者到消费者的路线,保证数据能按照指定的方式进行传输, Exchange:消息交换机,它指定消息按什么规则,路由到哪个队列. Queue:消息 ...
- 「ZJOI2019」线段树 解题报告
「ZJOI2019」线段树 听说有人喷这个题简单,然后我就跑去做,然后自闭感++,rp++(雾) 理性分析一波,可以发现最后形成的\(2^k\)个线段树,对应的操作的一个子集,按时间顺序作用到这颗线段 ...
- 单调栈+线段树——cf1220F
首先考虑初始排列,pi会让周围所有比其大的元素深度+1,所以要求每个点的深度,只要其被覆盖了几次即可 这个覆盖可以通过处理每个元素的左右边界(单调栈O(n))+线段树区间更新(Ologn(n))来做 ...
- NX二次开发-OLE/COM向EXCEL表格中插入图片
今晚有一个兄弟问我怎么往EXCEL里插入图片(加工程序单中需要插入图片),这个我之前也没弄过,回复了他一句不知道,后来刚刚干完游戏吃完鸡,就去VC++的书上翻了翻,还真的被我翻到了.VC++的方法往E ...
- js中浏览器对象BOM
参考 : https://www.cnblogs.com/Peng2014/p/4725524.html 1. window对象 https://www.runoob.com/jsref/ob ...
- python TypeError: ‘encoding’ is an invalid keyword argument for this function
shell调用python脚本出现了这个问题,查询原因得知,python脚本是python3.6写的,我们服务器上默认的python是python2.7.3,所以会出现编码问题. 解决思路: 1.安装 ...
- jQuery中html()再探究(转载)
我们先来看段代码,很简单,如下: /*html部分*/ <div id="div1"> <span>111</span> <span> ...
- python调用tushare获取IPO新股上市列表数据
接口:new_share 描述:获取新股上市列表数据 限量:单次最大2000条,总量不限制 积分:用户需要至少120积分才可以调取,具体请参阅本文最下方积分获取办法 注:tushare包下载和初始化教 ...
- Oracle中NEXTVAL 和 CURRVAL的使用
能够通过在 SQL 语句中使用 NEXTVAL 或 CURRVAL 运算符来訪问序列的值.必须用以 sequence.NEXTVAL 或sequence.CURRVAL 格式驻留在同一个数据库中的序列 ...
- python代码技巧总结(更新至17条)
怎么提高代码水平?答:看牛逼的代码! 牛逼的代码怎么写的?简单,明确,优雅! 怎么简单,明确,优雅?学技巧! 下面搜罗了一些有才格子褂青年的总结,哈哈 1.检查 Python 中的对象 调用 dir( ...