简介

逃逸分析我们在JDK14中JVM的性能优化一文中已经讲过了，逃逸分析的结果就是JVM会在栈上分配对象，从而提升效率。如果我们在多线程的环境中，如何提升内存的分配效率呢？快来跟小师妹一起学习TLAB技术吧。

逃逸分析和栈上分配

小师妹：F师兄，从前大家都说对象是在堆中分配的，然后我就信了。上次你居然说可以在栈上分配对象，这个实在是颠覆了我一贯的认知啊。

柏拉图说过：思想永远是宇宙的统治者。只要思想不滑坡，办法总比困难多。别人告诉你的都是一些最基本，最最通用的情况。而师兄我告诉你的则是在优化中的特列情况。

小师妹：F师兄，看起来JVM在提升运行速度方面真的做了不少优化呀。

是呀，Java从最开始被诟病速度慢，到现在执行速度直追C语言。这些运行时优化是必不可少的。还记得我们之前讲的逃逸分析是怎么回事吗？

小师妹：F师兄，这个我知道，如果一个对象的分配是在方法内部，并且没有多线程访问的情况下，那么这个对象其实可以看做是一个本地对象，这样的对象不管创建在哪里都只对本线程中的本方法可见，因此可以直接分配在栈空间中。

对的，栈上分配的对象因为不用考虑同步，所以执行速度肯定会更加快速，这也是为什么JVM会引入栈上分配的原因。

再举一个形象直观的例子。工厂要组装一辆汽车，在buildCar的过程中，需要先创建一个Car对象，然后给它按上轮子。

  public static void main(String[] args) {

    buildCar();

  }

  public static void buildCar() {

    Wheel whell = new Wheel(); //分配轮子

    Car car = new Car(); //分配车子

    car.setWheel(whell);

  }

}

class Wheel {}

class Car {

  private Wheel whell;

  public void setWheel(Wheel whell) {

    this.whell = whell;

  }

}

考虑一下上面的情况，如果假设该车间是一个机器人组装一台车，那么上面方法中创建的Car和Wheel对象，其实只会被这一个机器人访问，其他的机器人根本就不会用到这个车的对象。那么这个对象本质上是对其他机器人隐形的。所以我们可以不在公共空间分配这个对象，而是在私人的栈空间中分配。

逃逸分析还有一个作用就是lock coarsening。同样的，单线程环境中，锁也是不需要的，也可以优化掉。

TLAB简介

小师妹：F师兄，我觉得逃逸分析很好呀，栈上分配也不错。既然又这么厉害的两项技术了，为什么还要用到TLAB呢？

首先这是两个不同的概念，TLAB的全称是Thread-Local Allocation Buffers。Thread-Local大家都知道吧，就是线程的本地变量。而TLAB则是线程的本地分配空间。

逃逸分析和栈上分配只是争对于单线程环境来说的，如果在多线程环境中，不可避免的会有多个线程同时在堆空间中分配对象的情况。

这种情况下如何处理才能提升性能呢？

小师妹：哇，多个线程竞争共享资源，这不是一个典型的锁和同步的问题吗？

锁和同步是为了保证整个资源一次只能被一个线程访问，我们现在的情况是要在资源中为线程划分一定的区域。这种操作并不需要完全的同步，因为heap空间够大，我们可以在这个空间中划分出一块一块的小区域，为每个线程都分一块。这样不就解决了同步的问题了吗？这也可以称作空间换时间。

TLAB详解

小师妹，还记得heap分代技术中的一个中心两个基本点吗？哦，1个Eden Space和2个Suvivor Space吗？

Young Gen被划分为1个Eden Space和2个Suvivor Space。当对象刚刚被创建的时候，是放在Eden space。垃圾回收的时候，会扫描Eden Space和一个Suvivor Space。如果在垃圾回收的时候发现Eden Space中的对象仍然有效，则会将其复制到另外一个Suvivor Space。

就这样不断的扫描，最后经过多次扫描发现任然有效的对象会被放入Old Gen表示其生命周期比较长，可以减少垃圾回收时间。

因为TLAB关注的是新分配的对象，所以TLAB是被分配在Eden区间的，从图上可以看到TLAB是一个一个的连续空间。

然后将这些连续的空间分配个各个线程使用。

因为每一个线程都有自己的独立空间，所以这里不涉及到同步的概念。默认情况下TLAB是开启的，你可以通过：

-XX:-UseTLAB

来关闭它。

设置TLAB空间的大小

小师妹，F师兄，这个TLAB的大小是系统默认的吗？我们可以手动控制它的大小吗？

要解决这个问题，我们还得去看JVM的C++实现，也就是threadLocalAllocBuffer.cpp：

上面的代码可以看到，如果设置了TLAB（默认是0），那么TLAB的大小是定义的TLABSize除以HeapWordSize和max_size()中最小的那个。

HeapWordSize是heap中一个字的大小，我猜它=8。别问我为什么，其实我也是猜的，有人知道答案的话可以留言告诉我。

TLAB的大小可以通过：

-XX:TLABSize

来设置。

如果没有设置TLAB，那么TLAB的大小就是分配线程的平均值。

TLAB的最小值可以通过：

-XX:MinTLABSize

来设置。

默认情况下：

-XX:ResizeTLAB

resize开关是默认开启的，那么JVM可以对TLAB空间大小进行调整。

TLAB中大对象的分配

小师妹：F师兄，我想到了一个问题，既然TLAB是有大小的，如果一个线程中定义了一个非常大的对象，TLAB放不下了，该怎么办呢？

好问题，这种情况下又有两种可能性，我们假设现在的TLAB的大小是100K：

第一种可能性：

目前TLAB被使用了20K，还剩80K的大小，这时候我们创建了一个90K大小的对象，现在90K大小的对象放不进去TLAB，这时候需要直接在heap空间去分配这个对象，这种操作实际上是一种退化操作，官方叫做 slow allocation。

第二中个可能性：

目前TLAB被使用了90K，还剩10K大小，这时候我们创建了一个15K大小的对象。

这个时候就要考虑一下是否仍然进行slow allocation操作。

因为TLAB差不多已经用完了，为了保证后面new出来的对象仍然可以有一个TLAB可用，这时候JVM可以尝试将现在的TLAB Retire掉，然后分配一个新的TLAB空间，把15K的对象放进去。

JVM有个开关，叫做：

-XX:TLABWasteTargetPercent=N

这个开关的默认值是1。表示如果新分配的对象大小如果超出了设置的这个百分百，那么就会执行slow allocation。否则就会分配一个新的TLAB空间。

同时JVM还定义了一个开关：

-XX:TLABWasteIncrement=N

为了防止过多的slow allocation，JVM定义了这个开关（默认值是4），比如说第一次slow allocation的极限值是1%，那么下一次slow allocation的极限值就是%1+4%=5%。

TLAB空间中的浪费

小师妹：F师兄，如果新分配的TLAB空间，那么老的TLAB中没有使用的空间该怎么办呢？

这个叫做TLAB Waste。因为不会再在老的TLAB空间中分配对象了，所以剩余的空间就浪费了。

总结

本文介绍了逃逸分析和TLAB的使用。希望大家能够喜欢。

本文作者：flydean程序那些事

本文链接：http://www.flydean.com/jvm-escapse-tlab/

本文来源：flydean的博客

欢迎关注我的公众号:程序那些事，更多精彩等着您！

小师妹学JVM之:逃逸分析和TLAB的更多相关文章

小师妹学JVM之:深入理解JIT和编译优化-你看不懂系列
目录简介 JIT编译器 Tiered Compilation分层编译 OSR(On-Stack Replacement) Deoptimization 常见的编译优化举例 Inlining内联 Br ...
小师妹学JVM之:JDK14中JVM的性能优化
目录简介 String压缩分层编译(Tiered Compilation) Code Cache分层新的JIT编译器Graal 前置编译压缩对象指针 Zero-Based 压缩指针 Escap ...
小师妹学JVM之:JIT中的LogCompilation
目录简介 LogCompilation简介 LogCompilation的使用解析LogCompilation文件总结简介我们知道在JVM中为了加快编译速度,引入了JIT即时编译的功能.那么 ...
小师妹学JVM之:JIT中的PrintCompilation
目录简介 PrintCompilation 分析PrintCompilation的结果总结简介上篇文章我们讲到了JIT中的LogCompilation,将编译的日志都收集起来,存到日志文件里面 ...
小师妹学JVM之:java的字节码byte code简介
目录简介 Byte Code的作用查看Byte Code字节码 java Byte Code是怎么工作的总结简介 Byte Code也叫做字节码,是连接java源代码和JVM的桥梁,源代码编译 ...
小师妹学JVM之:JIT中的PrintAssembly
目录简介使用PrintAssembly 输出过滤总结简介想不想了解JVM最最底层的运行机制?想不想从本质上理解java代码的执行过程?想不想对你的代码进行进一步的优化和性能提升? 如果你的回 ...
小师妹学JVM之:JIT中的PrintAssembly续集
目录简介 JDK8和JDK14中的PrintAssembly JDK8中使用Assembly JDK14中的Assembly 在JMH中使用Assembly 总结简介上篇文章和小师妹一起介绍了P ...
小师妹学JVM之:cache line对代码性能的影响
目录简介一个奇怪的现象两个问题的答案 CPU cache line inc 和 add 总结简介读万卷书不如行万里路,讲了这么多assembly和JVM的原理与优化,今天我们来点不一样的实战 ...
小师妹学JVM之:JVM的架构和执行过程
目录简介 JVM是一种标准 java程序的执行顺序 JVM的架构类加载系统运行时数据区域执行引擎总结简介 JVM也叫Java Virtual Machine,它是java程序运行的基础,负 ...

随机推荐

ASP.NET通过更改Url进行页面传值
这里,通过假数据,手动创建的一个类,然后创建的一个集合,放入下拉框,选好值以后,点确定会在另一个页面产生对应的id,有不懂的欢迎评论创建一个类: using System; using Syste ...
Java实现 LeetCode 686 重复叠加字符串匹配
686. 重复叠加字符串匹配给定两个字符串 A 和 B, 寻找重复叠加字符串A的最小次数,使得字符串B成为叠加后的字符串A的子串,如果不存在则返回 -1. 举个例子,A = "abcd&q ...
Java实现 LeetCode 212 单词搜索 II
public class Find2 { public int[] dx={1,-1,0,0}; public int[] dy={0,0,1,-1}; class Trie{ Trie[] trie ...
java实现复制网站内容
复制网站内容复制代码本程序将网站"www.baidu.com"首页的内容复制保存在文件test.html中.写了如下代码,请完善之: import java.net.*; im ...
PAT 有理数四则运算
本题要求编写程序,计算 2 个有理数的和.差.积.商. 输入格式: 输入在一行中按照 a1/b1 a2/b2 的格式给出两个分数形式的有理数,其中分子和分母全是整型范围内的整数,负号只可能出现在分子前 ...
（七）DVWA之SQL Injection--SQLMap测试（Low）
目录结构一.测试需求分析二.SQLMap利用SQL注入漏洞,获取数据库信息 1.判断是否存在注入点 2.获取DBMS中所有的数据库名称 3.获取Web应用当前连接的数据库 4.列出数据库中的所有用 ...
PHP文件包含整理
文件包含目录文件包含 1. 概述 1.1 常见的引发漏洞的函数: 1.2 利用条件 1.3 分类和利用思路 2. 利用方法 2.1 配合文件解析漏洞来包含 2.2 读取系统敏感文件(路径遍历) 2 ...
ZWave对COMAND CLASS的处理流程
文章主题在开发一个 ZWave Device 的过程中,对 COMAND CLASS(单词太长了,后面就简写为 CC 啦) 的处理是最基本.最重要的工作.这篇文章以最最简单的 CC:COMMNAD ...
ZWave 数据包格式
ZWave Device 的过程中,其实就是对不同的 COMMAND CLASS 进行解析处理.在刚开始进入ZWAVE 开发时,为了弄清楚数据包的格式,做了下面的参考表格.不过后来发现用来抓包的 sn ...
解决mysql插入数据l出现"the table is full"的问题
需要修改Mysql的配置文件my.ini,在[mysqld]下添加/修改两行:tmp_table_size = 256Mmax_heap_table_size = 256M

小师妹学JVM之:逃逸分析和TLAB

简介