cpu缓存java性能问题初探

在内存与cpu寄存器之间，还有一块区域叫做cpu高速缓存，即我们常常说的cache。

cache分为L1、L2、L3三级缓存，速度递减，离cpu越来越远，L1、L2每个内核自己都有，L3是每个插槽上的多个内核共用一个。cpu按照值使用频道来从1、2、3缓存逐个进行检索，L1如果没有命中，就向下继续检索L2、L3直到内存。

从CPU到	大约需要的CPU周期	大约需要的时间(单位ns)
寄存器	1 cycle
L1 Cache	~3-4 cycles	~0.5-1 ns
L2 Cache	~10-20 cycles	~3-7 ns
L3 Cache	~40-45 cycles	~15 ns
跨槽传输		~20 ns
内存	~120-240 cycles	~60-120ns

在上述缓存的存取与检索读取的操作中，最基本的单位（即内核操作缓存的最基本单位）成为缓存行（cache line），一般情况下，cache line的大小为64字节。

举个例子，我们可以设想，对于顺序存储的一个数组而言，当我们从内存中读取一个数组元素进缓存的时候，要一次读取64字节，那么这样就会将我们需要读取的元素后面的若干个8字节long也一并都进了缓存，并且这是在一个操作里完成的，没有额外的花费。大大提高了性能。

但如果我们的程序故意捣乱，干扰cpu的这种优化机制呢？

http://coderplay.iteye.com/blog/1485760 中的一个示例程序，我加了点注释。（在此谢过原作者）

public class L1CacheMiss {

    private static final int RUNS = 10;

    private static final int DIMENSION_1 = 1024 * 1024;

    private static final int DIMENSION_2 = 62;

    private static long[][] longs;  

    public static void main(String[] args) throws Exception {

            /*初始化一个1024*1024行、62列的二位数组（矩阵），矩阵的每个元素都是0*/

        Thread.sleep(10000);

        longs = new long[DIMENSION_1][];

        for (int i = 0; i < DIMENSION_1; i++) {

            longs[i] = new long[DIMENSION_2];

            for (int j = 0; j < DIMENSION_2; j++) {

                longs[i][j] = 0L;

            }

        }

        System.out.println("starting....");  

        final long start = System.nanoTime();

        long sum = 0L;

        for (int r = 0; r < RUNS; r++) {

            /*对列遍历，然后逐个累加每列中所有行*/

//          for (int j = 0; j < DIMENSION_2; j++) {

//              for (int i = 0; i < DIMENSION_1; i++) {

//                  sum += longs[i][j];

//              }

//          }

                  /*对行遍历，然后逐个累加每行中所有列*/

            for (int i = 0; i < DIMENSION_1; i++) {

                for (int j = 0; j < DIMENSION_2; j++) {

                    sum += longs[i][j];

                }

            }

        }

        System.out.println("duration = " + (System.nanoTime() - start));

    }

}

执行结果：

starting.... duration = 679,818,029 sum = 0

starting.... duration = 12,850,546,522 sum = 0

先对行遍历只用不到1秒，而先对列遍历的话要用12秒！

如果在linux环境下，可以用perf stat -e L1-dcache-load-misses java L1CacheMiss 命令来查看L1 cache的未命中次数。

cpu缓存java性能问题初探的更多相关文章

【学习总结】cpu缓存
参考链接: cpu缓存java性能问题初探高速缓存在内存与cpu寄存器之间,还有一块区域叫做cpu高速缓存,即我们常常说的cache. cache分为L1.L2.L3三级缓存,速度递减,离cpu越 ...
基于JVM原理、JMM模型和CPU缓存模型深入理解Java并发编程
许多以Java多线程开发为主题的技术书籍,都会把对Java虚拟机和Java内存模型的讲解,作为讲授Java并发编程开发的主要内容,有的还深入到计算机系统的内存.CPU.缓存等予以说明.实际上,在实际的 ...
从Java视角理解CPU缓存和伪共享
转载自:http://ifeve.com/from-javaeye-cpu-cache/ http://ifeve.com/from-javaeye-false-shari ...
写Java也得了解CPU–CPU缓存
CPU,一般认为写C/C++的才需要了解,写高级语言的(Java/C#/pathon…)并不需要了解那么底层的东西.我一开始也是这么想的,但直到碰到LMAX的Disruptor,以及马丁的博文,才发现 ...
【Java并发编程】从CPU缓存模型到JMM来理解volatile关键字
目录并发编程三大特性原子性可见性有序性 CPU缓存模型是什么高速缓存为何出现? 缓存一致性问题如何解决缓存不一致 JMM内存模型是什么 JMM的规定 Java对三大特性的保证原子性可见 ...
第三章 - CPU缓存结构和java内存模型
CPU 缓存结构原理 CPU 缓存结构查看 cpu 缓存速度比较查看 cpu 缓存行 cpu 拿到的内存地址格式是这样的 CPU 缓存读根据低位,计算在缓存中的索引判断是否有效 0 去内存读 ...
java cpu缓存
众所周知, CPU是计算机的大脑, 它负责执行程序的指令; 内存负责存数据, 包括程序自身数据. 同样大家都知道, 内存比CPU慢很多. 其实在30年前, CPU的频率和内存总线的频率在同一个级别, ...
从Java视角理解CPU缓存(CPU Cache)
从Java视角理解系统结构连载, 关注我的微博(链接)了解最新动态众所周知, CPU是计算机的大脑, 它负责执行程序的指令; 内存负责存数据, 包括程序自身数据. 同样大家都知道, 内存比CPU慢很多 ...
【初探】java性能火焰图的生成
前言开始之前,你需要准备的环境: Linux系统机器或者虚拟机一台,里面需要安装的软件:git.jdk.perl. 简单介绍: java性能分析火焰图的所做的事情就是能够分析出java程序运行期间存 ...

随机推荐

无法打开登录所请求的数据库 "****"。登录失败
错误:无法打开登录所请求的数据库 "****".登录失败.用户 '****' 登录失败. sql2005连接时出现的错误解决方法:权限不够,给登录名授权,赋予管理员角色,在登录名 ...
Linux中chown、chmod、chgrp
1.chgrp (转变文件所属用户组) chgrp(转变文件所属用户组)change group chgrp 用户组文件名 ###便是这个格了.若是整个目次下的都改,则加-R参数用于递归. 如:ch ...
IDEA 工具下导出文件及文件的目录结构插件
idea导出增量补丁插件有时候需要导出IDEA的文件目录结构,即导出指定修改后的JAVA文件编译后的CLASS .或者是修改过的jsp.配置文件等, 装载此插件,即可以完成导出文件及文件的目 ...
nginx反向代理部署与演示(二)
我们把LB01作为负载均衡器,WEB01和WEB02作为两台web服务器. WEB01与WEB02虚拟主机配置如下: 我们修改nginx下的conf/nginx.conf文件,在http{}中 ...
git pull和git fetch命令
git pull和git fetch命令 git pull git pull命令的作用是取回远程主机某个分支的更新,在与本地指定分支合并,格式如下: $ git pull <远程主机名>& ...
Phalcon Framework的MVC结构及启动流程分析
目前的项目中选择了Phalcon Framework作为未来一段时间的核心框架.技术选型的原因会单开一篇Blog另说,本次优先对Phalcon的MVC架构与启动流程进行分析说明,如有遗漏还望指出. P ...
LUOGU P4408 [NOI2003]逃学的小孩（树的直径）
题目描述 Chris家的电话铃响起了,里面传出了Chris的老师焦急的声音:“喂,是Chris的家长吗?你们的孩子又没来上课,不想参加考试了吗?”一听说要考试,Chris的父母就心急如焚,他们决定在尽 ...
PLSQL 块demo
DECLARE v_servid NUMBER(16); v_stdno VARCHAR2(30); BEGIN FOR i IN (SELECT rownum rn, t.* ...
[开源,学习,分享]UWP第三方简书客户端分享
简介 Windows10正式版发布到现在,我利用零零碎碎的一些时间对UWP进行一些学习,也基于这门技术开发了一个第三方的简书App. 基本界面优酷视频: http://v.youku.com/v_s ...
更新vs2017 15.9.2后，在指定-T v141_xp情况下载编译会报下面warning MSB8051
更新vs2017 15.9.2后,在指定-T v141_xp情况下载编译会报下面warning: C:\Program Files (x86)\Microsoft Visual Studio\2017 ...

cpu缓存java性能问题初探

cpu缓存java性能问题初探的更多相关文章

随机推荐

热门专题