Twitter 工程师谈 JVM 调优
一. 调优需要关注的几个方面
- 内存调优
- CPU 使用调优
- 锁竞争调优
- I/O 调优
二. Twitter 最大的敌人:延迟
导致延迟的几个原因?
- 最大影响因素是 GC
- 其他的有:锁和线程调度、I/O、算法数据结构选取不当效率低
三. 内存性能调优
(1)内存占用调优
OutOfMemoryError 异常原因:可能真的数据量太大、可能要数据显示的太多、可能内存泄露
数据量太大观察及解决:
- 查看 GC 日志, 看 Full GC 前后内存变化, 变化不大说明确实数据量太大
- 尝试增加 JVM 的内存使用
- 考虑这些数据是否真的需要都在内存中吗? 可以考虑使用: LRU 算法换入换出等, 弱引用(Soft References)
数据臃肿(Fat data)
- 当你想做一些奇怪的事情时候回发生数据占用太大问题,比如:把整个社交图谱加载到单个 JVM 实例上、加载全部用户的元数据到单个 JVM 实例上
- 在 Twitter 这样大的规模下减少内部数据呈现工作
数据臃肿原因:
(1)对象头(JVM 对象头一般占用两个机器码,在 32-bit JVM 上占用 64bit, 在 64-bit JVM 上占用 128bit 即 16 bytes, 例如:new java.lang.Object() 占用 16 bytes; new byte[0] 占用 24 bytes) 更多对象头内容参考:http://blog.csdn.net/wenniuwuren/article/details/50939410
(2)填充补全
看个例子
public static class D {
byte d1;
}
public static class E extends D {
byte e1;
}
new D() 占用 24 bytes 空间, new E() 占用 32 bytes 空间。 具体空间计算参考:http://blog.csdn.net/wenniuwuren/article/details/50958892
现在一般是 64-bit 的 JVM,64-bit 的指针会导致 CPU 缓存相比 32-bit 指针减少很多, 所以建议 JVM 参数加入 -XX:+UseCompressedOops 采用指针压缩将 64-bit 指针压缩为 32-bit, 但是却又能使用 64-bit 的内存空间, 达到一举两得的作用。另外,建议最大堆小于 30G。
尽量别使用原始类型对象的包装类
在 Scala 2.7.7 中:Seq[Int] 存 Integer,Array[Int] 存 int, 第一个空间占用 (24 + 32*length) bytes,第二个空间占用 (24 + 4*length) bytes。
在 Scala 2.8 中修复了这个问题, 从这我们可以看出:
- 你不清楚你所使用类库的性能特征(比如能用 int 就用 int)
- 除非在性能分析工具下运行, 否则你可能永远不知道这个问题
Map 空间占用(Map footprints)
- Guava MapMaker.makeMap() 占用 2272 bytes
- MapMaker.concurrencyLevel(1).makeMap() 占用 352 bytes
小心使用 Thread Local
典型的问题在线程池 m*n 的资源相关,如 200 线程池使用了 50 个连接,最终有 10000 个连接缓存
考虑使用同步对象或者每次新建一个对象
四. 与延迟做斗争
性能三角
图1:内存占用下降,延迟下降,吞吐量上升

图2:压缩(Compactness,即减小内存占用)率上升,吐量上升,响应速度上升

新生代是如何工作的?
- 所有新对象分配在 Eden 代,因为新生代 GC 有压缩,所以内存分配用指针碰撞
- 当 Eden 满的时候,进行一次 stop-the-world 的 Minor GC,存活下来的放到 Survivor
- 经过几次 Minor GC,还存活下来的对象会被提升(tenured)到老年代
理想化得新生代操作
- Eden 代足够容纳超过一组并发的请求和响应对象(这样没有 stop-the-world,吞吐量会比较高)
- 每个 Survivor 空间足够容纳活跃对象和有年龄的对象(减少过早提升到老年代)
- 提升阈值正好能让存活时间长的对象早点提升到老年代(给 Survivor 腾出空间)
从新生代开始调优
- 打印详细 GC 日志, 如开启 JVM 参数:-XX:+PrintGCDetails,-XX:+PrintGCDateStamps,-XX:+PrintHeapAtGC,-XX:+PrintTenuringDistribution 等等…
- 关注 Survivor 大小,设置合适的 Survivor 大小
- 关注提升阈值,使长期存活对象快速提升到老年代
(1)-XX:+PrintHeapAtGC
Heap after GC invocations=1 (full 0): par new generation total 943744K, used 54474K [0x0000000757000000, 0x0000000797000000, 0x0000000797000000) eden space 838912K, 0% used [0x0000000757000000, 0x0000000757000000, 0x000000078a340000) from space 104832K, 51% used [0x00000007909a0000, 0x0000000793ed2ae0, 0x0000000797000000) to space 104832K, 0% used [0x000000078a340000, 0x000000078a340000, 0x00000007909a0000) concurrent mark-sweep generation total 1560576K, used 0K [0x0000000797000000, 0x00000007f6400000, 0x00000007f6400000) concurrent-mark-sweep perm gen total 159744K, used 38069K [0x00000007f6400000, 0x0000000800000000, 0x0000000800000000) }
(2)-XX:+PrintTenuringDistribution
Desired survivor size 53673984 bytes, new threshold 4 (max 6) - age 1: 9165552 bytes, 9165552 total - age 2: 2493880 bytes, 11659432 total - age 3: 6817176 bytes, 18476608 total - age 4: 36258736 bytes, 54735344 total : 899459K->74786K(943744K), 0.0654030 secs] 1225769K->401096K(2504320K), 0.0657530 secs] [Times: user=0.55 sys=0.00, real=0.07 secs]
CMS 调优
- CMS 收集器需要更多的内存, 尽量多分配就对了
- 减少碎片、避免 Full GC
- -XX:CMSInitiatingOccupancyFraction=n n一般设置为 75-80(太早启动降低吞吐量,太晚启动导致 concurrent mode failed)
响应速度还是太慢?
- Minor GC 时有太多存活对象,尝试减少新生代空间,减少 Survivor 空间,减少晋升阈值
- 太多线程。尝试找到最小的并发层次或者增加更多 JVM 实例
- 尝试使用 Volatile 而不是 synchronized 减少锁竞争,尝试使用 Atomic* 的原子类
用分配 slab 应对 CMS 的碎片问题
Apache 的 Cassandra 内部使用 slab 分配。每个 slab 大小为 2MB,使用 CAS 复制 byte[] 到里面,使用 Cassandra 前开销为 30-60 秒每小时, 使用后在3天零十小时开销 5 秒。
使用分配 slab 的方式有一些局限性:在缓存满的时候才把缓存内容写进磁盘,而且对象需要转化为二进制等问题。
Twitter 工程师谈 JVM 调优的更多相关文章
- JVM 调优 内存调优 CPU 使用调优 锁竞争调优 I/O 调优
Twitter 工程师谈 JVM 调优 2016年03月24日 10:22:30 wenniuwuren https://blog.csdn.net/wenniuwuren/article/detai ...
- JVM调优:GC 参数
2019独角兽企业重金招聘Python工程师标准>>> JVM调优:GC 参数 博客分类: java jvm 参考: <Memory Management in the Jav ...
- JVM调优浅谈
1.数据类型 java虚拟机中,数据类型可以分为两类:基本类型和引用类型.基本类型的变量保存原始值,即:它代表的值就是数值本身,而引用类型的变量保存引用值.“引用值”代表了某个对象的引用,而不是对象本 ...
- JVM调优浅谈(转)
1.数据类型 java虚拟机中,数据类型可以分为两类:基本类型和引用类型.基本类型的变量保存原始值,即:它代表的值就是数值本身,而引用类型的变量保存引用值.“引用值”代表了某个对象的引用,而不是对象本 ...
- 老李分享:JVM调优
老李分享:JVM调优 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.如果对课程感兴趣,请大家咨询qq:908821478,咨 ...
- SpringBoot项目优化和Jvm调优(转)
原文:https://blog.csdn.net/wd2014610/article/details/82182617 项目调优作为一名工程师,项目调优这事,是必须得熟练掌握的事情. 在SpringB ...
- SpringBoot项目优化和Jvm调优(楼主亲测,真实有效)
项目调优 作为一名工程师,项目调优这事,是必须得熟练掌握的事情. 在SpringBoot项目中,调优主要通过配置文件和配置JVM的参数的方式进行. 在这边有一篇比较好的文章,推荐给大家! Spring ...
- JVM调优小结
JVM调优浅谈 https://www.cnblogs.com/andy-zhou/p/5327288.html 1.数据类型 java虚拟机中,数据类型可以分为两类:基本类型和引用类型. 基本类 ...
- SpringBoot项目优化和Jvm调优
https://www.cnblogs.com/jpfss/p/9753215.html 项目调优 作为一名工程师,项目调优这事,是必须得熟练掌握的事情. 在SpringBoot项目中,调优主要通过配 ...
随机推荐
- ubuntu14.04+opencv 3.0+python2.7安装及测试
本文记录了ubuntu下使用源码手动安装opencv的过程.步骤来自opencv官网 此外记录了在python中安装及载入opencv的方法. 1.安装opencv所需的库(编译器.必须库.可选库) ...
- Shell符号展开
字符 展开 * 这个 “*” 字符意味着匹配文件名中的任意字符 shell 把 “*” 展开成了另外的东西 ,在 echo 命令被执行前. ~家目录 算术表达式展开 算术表达式展开使用这种格式: $( ...
- properties文件的继承(套用)关系
现项目中有多个配置文件分布于/props____def.properties____/env_______def.propertiess_______/dev_______def.properties ...
- php练习4——排序,查找
排序(从小到大) 查找 注:二分法查找的数组默认为已经排序的数组
- PHP分页初探 一个最简单的PHP分页代码实现
PHP分页代码在各种程序开发中都是必须要用到的,在网站开发中更是必选的一项. 要想写出分页代码,首先你要理解SQL查询语句:select * from goods limit 2,7.PHP分页代码核 ...
- MDK常用快捷键
一.常用编译相关的快捷键 1.编译(单个文件) Ctrl+F7 2.连接 F7 二.常用调试相关的快捷键 1.运行/停止 Ctrl+F5 2.Run(全速运行) F5 3.Stop Deb ...
- 安卓手机无法连接VPN的解决办法
这篇不能算是技术博客吧,但是在网上很难找到解决方案,至少我找了好久也没弄好.. 三种方案,因机而异,我就长话短说了: 一. "/system/xbin" 和 "/syst ...
- Tekla Structures 使用类库概览
Tekla Structures 2016 已经发布了,使用了 Ribbon 的全新 UI 风格,比以前要漂亮许多. 不过功能方面貌似没啥大的改进,感觉天宝的主要精力都投入到了混凝土模块上,忙着和别人 ...
- UISearchBar -- 备忘
搜索功能的备忘 UISearchBar UISearchBar是一个搜索栏,继承自UIView,也是常用的控件之一,所以特别写一篇备忘方便以后做工具文章. 例子: let searchBar = UI ...
- Mybatis 学习
1. Mybatis 中 # 与 $ 符号的区别: a. #将传入的数据都当成一个字符串,会对自动传入的数据加一个双引号. 如:order by #user_id#,如果传入的值是12,那么解 ...