[JDK8]性能优化之使用LongAdder替换AtomicLong

如果让你实现一个计数器，有点经验的同学可以很快的想到使用AtomicInteger或者AtomicLong进行简单的封装。

因为计数器操作涉及到内存的可见性和线程之间的竞争，而Atomic***的实现完美的屏蔽了这些技术细节，我们只需要执行相应的方法，就能实现对应的业务需求。

Atomic**虽然好用，不过这些的操作在并发量很大的情况下，性能问题也会被相应的放大。我们可以先看下其中getAndIncrement的实现代码

public final long getAndIncrement() {

    return unsafe.getAndAddLong(this, valueOffset, 1L);

}

// unsafe类中的实现

public final long getAndAddLong(Object var1, long var2, long var4) {

    long var6;

    do {

        var6 = this.getLongVolatile(var1, var2);

    } while(!this.compareAndSwapLong(var1, var2, var6, var6 + var4));

    return var6;

}

很显然，在getAndAddLong实现中，为了实现正确的累加操作，如果并发量很大的话，cpu会花费大量的时间在试错上面，相当于一个spin(自旋)的操作。如果并发量小的情况，这些消耗可以忽略不计。

既然已经意识到Atomic***有这样的业务缺陷，Doug Lea大神又给我们提供了LongAdder，内部的实现有点类似ConcurrentHashMap的分段锁，最好的情况下，每个线程都有独立的计数器，这样可以大量减少并发操作。

下面通过JMH比较一下AtomicLong 和 LongAdder的性能。

@OutputTimeUnit(TimeUnit.MICROSECONDS)

@BenchmarkMode(Mode.Throughput)

public class Main {

    private static AtomicLong count = new AtomicLong();

    private static LongAdder longAdder = new LongAdder();

    public static void main(String[] args) throws Exception {

        Options options = new OptionsBuilder().include(Main.class.getName()).forks(1).build();

        new Runner(options).run();

    }

    @Benchmark

    @Threads(10)

    public void run0(){

        count.getAndIncrement();

    }

    @Benchmark

    @Threads(10)

    public void run1(){

        longAdder.increment();

    }

}

1、设置BenchmarkMode为Mode.Throughput，测试吞吐量
2、设置BenchmarkMode为Mode.AverageTime，测试平均耗时

线程数为1

1、吞吐量

Benchmark   Mode  Cnt    Score   Error   Units

Main.run0  thrpt    5  154.525 ± 9.767  ops/us

Main.run1  thrpt    5   89.599 ± 7.951  ops/us

2、平均耗时

Benchmark  Mode  Cnt  Score    Error  Units

Main.run0  avgt    5  0.007 ±  0.001  us/op

Main.run1  avgt    5  0.011 ±  0.001  us/op

单线程情况：
1、AtomicLong的吞吐量和平均耗时都占优势

线程数为10

1、吞吐量

Benchmark   Mode  Cnt    Score     Error   Units

Main.run0  thrpt    5   37.780 ±   1.891  ops/us

Main.run1  thrpt    5  464.927 ± 143.207  ops/us

2、平均耗时

Benchmark  Mode  Cnt  Score   Error  Units

Main.run0  avgt    5  0.290 ± 0.038  us/op

Main.run1  avgt    5  0.021 ± 0.001  us/op

并发线程为10个时：

LongAdder的吞吐量比较大，是AtomicLong的10倍多。
LongAdder的平均耗时是AtomicLong的十分之一。

线程数为30

1、吞吐量

Benchmark   Mode  Cnt    Score    Error   Units

Main.run0  thrpt    5   36.215 ±  2.341  ops/us

Main.run1  thrpt    5  486.630 ± 26.894  ops/us

2、平均耗时

Benchmark  Mode  Cnt  Score   Error  Units

Main.run0  avgt    5  0.792 ± 0.021  us/op

Main.run1  avgt    5  0.063 ± 0.002  us/op

线程数为30个时：

LongAdder的吞吐量比较大，也是AtomicLong的10倍多。
LongAdder的平均耗时也是AtomicLong的十分之一。

总结

一些高并发的场景，比如限流计数器，建议使用LongAdder替换AtomicLong，性能可以提升不少。

[JDK8]性能优化之使用LongAdder替换AtomicLong的更多相关文章

Java内存溢出优化性能优化
高性能应用构成了现代网络的支柱.LinkedIn有许多内部高吞吐量服务来满足每秒数千次的用户请求.要优化用户体验,低延迟地响应这些请求非常重要. 比如说,用户经常用到的一个功能是了解动态信息——不断更 ...
网站性能优化小结和spring整合redis
现在越来越多的地方需要非关系型数据库了,最近网站优化,当然从页面到服务器做了相应的优化后,通过在线网站测试工具与之前没优化对比,发现有显著提升. 服务器优化目前主要优化tomcat,在tomcat目录 ...
44个Java性能优化
44个Java性能优化首先,代码优化的目标是: 减小代码的体积提高代码运行效率代码优化细节 1 .尽量指定类.方法的final修饰符带有final修饰符的类是不可派生的.在Java核心AP ...
使用Async-profiler 对程序性能优化实战
原文在简书上, https://www.jianshu.com/p/f8336b835978 1.背景目前有一个kafka消费者工程,此工程会消费kafka中的消息,并通过fastjson解析该消息 ...
JVM性能优化系列-(1) Java内存区域
1. Java内存区域 1.1 运行时数据区 Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域.主要包括:程序计数器.虚拟机栈.本地方法栈.Java堆.方法区(运 ...
Web性能优化：图片优化
程序员都是懒孩子,想直接看自动优化的点:传送门我自己的Blog:http://cabbit.me/web-image-optimization/ HTTP Archieve有个统计,图片内容已经占到 ...
【腾讯Bugly干货分享】Android性能优化典范——第6季
本文来自于腾讯bugly开发者社区,非经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/580d91208d80e49771f0a07c 导语这里是Android性能优 ...
【腾讯Bugly干货分享】跨平台 ListView 性能优化
本文来自于腾讯Bugly公众号(weixinBugly),未经作者同意,请勿转载,原文地址:https://mp.weixin.qq.com/s/FbiSLPxFdGqJ00WgpJ94yw 导语精 ...
CSS3与页面布局学习总结（八）——浏览器兼容与前端性能优化
一.浏览器兼容 1.1.概要世界上没有任何一个浏览器是一样的,同样的代码在不一样的浏览器上运行就存在兼容性问题.不同浏览器其内核亦不尽相同,相同内核的版本不同,相同版本的内核浏览器品牌不一样,各种运 ...

随机推荐

LeetCode算法题-Two Sum IV - Input is a BST（Java实现）
这是悦乐书的第280次更新,第296篇原创 01 看题和准备今天介绍的是LeetCode算法题中Easy级别的第148题(顺位题号是653).给定二进制搜索树和目标数,如果BST中存在两个元素,使得 ...
spring上下文和springMVC上下文的关系
查看原文
day5-python的文件操作-坚持就好
目录摘要文件处理 1.文件初识 2.文件的读操作 3.文件的写操作 4.文件的追加操作 5.文件的其他操作 6.文件的修改正式开始文件处理:写了这么多代码了,有的时候我们执行完成的结果想永久保存 ...
Framework7 索引列表插件的异步加载实现
前言 Framework7 作为移动端的开发框架的优良之处已经无需多言.现在已经有了 React 和 Vue 版本,之前在项目中用过 F7 + vue 的开发方式,无论是效率还是产出都近乎完美.有时间 ...
Django之 Form和ModelForm组件
01-Form介绍我们之前在HTML页面中利用form表单向后端提交数据时,都会写一些获取用户输入的标签并且用form标签把它们包起来. 与此同时我们在好多场景下都需要对用户的输入做校验,比如校验用 ...
pyspider煎蛋无聊图爬取
命令行pyspider,启动pyspider. web预览界面太小,解决方法:找到pyspider的安装路径下的debug.min.css,修改css代码: 将其中的iframe{border-wid ...
2 数据分析之Numpy模块（1）
Numpy Numpy(Numerical Python的简称)是高性能科学计算和数据分析的基础包.它是我们课程所介绍的其他高级工具的构建基础. 其部分功能如下: ndarray, 一个具有复杂广播能 ...
hMailServer安装汉化方法
https://www.hmailserver.org/viewtopic.php?f=5&t=13
win10设置操作备忘
添加密码, 更改密码: Win键-->左侧用户图标-->更改帐户设置-->登陆选项-->添加密码 | 更改密码
[转帖] CA如何保护自己的私钥
作者:Gh0u1L5链接:https://www.zhihu.com/question/22260090/answer/648910720来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业 ...

[JDK8]性能优化之使用LongAdder替换AtomicLong

总结

[JDK8]性能优化之使用LongAdder替换AtomicLong的更多相关文章

随机推荐

热门专题