原文:http://kilik.iteye.com/blog/677253

  

  最近在研究java的性能调优,顺手写了一个小程序来测试性能问题。这个程序用来进行矩阵乘法运算,如下:

for (int i = 0; i < 2048; i++)
for (int j = 0; j < 2048; j++)
for (int k = 0; k < 2048; k++)
res[i][j] += mul1[i][k] * mul2[k][j];

  在ubuntu 10.04(64bit)下,JDK 1.6.0.20运行该程序共耗时76秒。分析下来,影响运行速度的因素主要有两个:cache miss  和 TLB miss.

  这里主要讲TLB miss的问题,cache miss留待下回分解。由于,在默认情况下内存分页大小为4K, 而每次作乘法时,取值均跨至少8K(4*2048)的范围,而一级数据页表缓存(L1 DTLB)是非常小的,Intel Core 2架构下4KB小页表的条目只有16个。这意味着TLB miss的概率很高,最差情况下每次数据访问都将出现一次miss;而使用大内存分页(如,2M)后,大概每256次数据访问出现一次miss。实际情况确实反映了这一现象,使用大内存页后,同样的程序耗时大幅下降到45秒。

  接下来介绍如何在Ubuntu 10.04(64bit) + JDK (Hotspot 1.6.0.20) 环境下启用大内存页,并指定jvm使用大内存页。这些步骤应该也可以应用到其他linux系统。(注,为完成下列步骤,用户需要有root权限)

  1. 了解linux系统对大内存页的支持。

    # grep Huge /proc/meminfo

    HugePages_Total: 0
    HugePages_Free: 0
    Hugepagesize: 2048 kB

    说明,系统支持2M的大内存分页。

  2. 修改内核参数,为large page预留内存

  a. 设置共享内存段最大值,最少要大于jvm使用的large page的内存。

  如需要设置大小为2G(1024*1024*1024*2=2147483648),则添加下行到文件 /etc/sysctl.conf

   kernel.shmmax=2147483648

  b. 设置需要预留多少大内存页。

  如需要为jvm预留1G的large page内存,则需要预留512页大内存页(512*2M=1G)

  添加下行到文件 /etc/sysctl.conf

  vm.nr_hugepages=512

  3. 为你的进程添加访问large page共享内存段的权限

  添加新的用户组,并把自己加入到这个组。如,添加用户组 hugetlb,并把当前用户 kilik 添加到该组。

  添加下行到文件 /etc/sysctl.conf ,其中1001为用户组hugetlb的gid。

  vm.hugetlb_shm_group = 1001

  4. 修改用户安全设置,允许进程锁定更大的内存段

  large page共享内存必须锁定到主存,不能swap到磁盘,因此需要修改用户的memlock设置。添加如下两行到文件 /etc/security/limits.conf。其中,1048576代表1G(1024*1024 K)

  kilik    hard    memlock    1048576 
       kilik    soft    memlock    1048576

  5. 重启OS以使上述设置生效。

  6. 添加相关jvm运行参数,告诉jvm使用large page内存。

  不同的jvm有不同的参数设置来开启大内存页的支持,对Sun Hotspot而言,这个参数是 -XX:+UseLargePages。因此可以使用如下命令行来运行矩阵乘法程序。

   java -XX:+UseLargePages -Xmx512m -Xms512m -cp . org.kilik.perf.ClassicMatrixMulti

  

  Java程序实现矩阵乘法:https://blog.csdn.net/Waria/article/details/77417751

/**
* 矩阵乘法
* a点乘b,当矩阵a的列数x与矩阵b的行数y相等时可进行相乘
* a乘b得到的新矩阵c,c的行数y等于a的行数,c的列数x等于b的列数
* Created by Queena on 2017/8/19.
*/
public class MatrixMultiplication {
public static int[][] matrix(int a[][], int b[][]) {
//当a的列数与矩阵b的行数不相等时,不能进行点乘,返回null
if (a[0].length != b.length)
return null;
//c矩阵的行数y,与列数x
int y = a.length;
int x = b[0].length;
int c[][] = new int[y][x];
for (int i = 0; i < y; i++)
for (int j = 0; j < x; j++)
//c矩阵的第i行第j列所对应的数值,等于a矩阵的第i行分别乘以b矩阵的第j列之和
for (int k = 0; k < b.length; k++)
c[i][j] += a[i][k] * b[k][j];
return c;
}

  

Java的大内存分页支持的更多相关文章

  1. JVM优化之调整大内存分页(LargePage)

    转自:http://cjjwzs.iteye.com/blog/1059381 本文将从内存分页的原理,如何调整分页大小两节内容,向你阐述LargePage对JVM的性能有何提升作用,并在文末点明了大 ...

  2. Java 5大内存区域和对象的创建过程

    1.Java运行时数据区 方法区,堆线程共享.虚拟机栈,本地方法栈和程序计数器线程私有. 2.程序计数器(PC计数器) 占用较小的一块内存空间,当执行Java方法时记录正在执行的虚拟机字节码指令地址, ...

  3. 高端面试必备:一个Java对象占用多大内存

    这个问题一般会出现在稍微高端一点的 Java 面试环节.要求面试者不仅对 Java 基础知识熟悉,更重要的是要了解内存模型. Java 对象模型 HotSpot JVM 使用名为 oops (Ordi ...

  4. 一个Java对象到底占用多大内存?

    最近在读<深入理解Java虚拟机>,对Java对象的内存布局有了进一步的认识,于是脑子里自然而然就有一个很普通的问题,就是一个Java对象到底占用多大内存? 在网上搜到了一篇博客讲的非常好 ...

  5. 一个Java对象到底占用多大内存

    在网上搜到了一篇博客讲的非常好,里面提供的这个类也非常实用: import java.lang.instrument.Instrumentation; import java.lang.reflect ...

  6. 一个Java对象到底占多大内存

    最近在读<深入理解Java虚拟机>,对Java对象的内存布局有了进一步的认识,于是脑子里自然而然就有一个很普通的问题,就是一个Java对象到底占用多大内存? 在网上搜到了一篇博客讲的非常好 ...

  7. 一个Java对象到底占多大内存?(转)

    最近在读<深入理解Java虚拟机>,对Java对象的内存布局有了进一步的认识,于是脑子里自然而然就有一个很普通的问题,就是一个Java对象到底占用多大内存? 在网上搜到了一篇博客讲的非常好 ...

  8. eclipse启动不起来,eclipse.ini配置问题(支持大内存64bit问题)

    Eclipse 启动不起来异常:JVM terminated. Exit code=-1 Eclipse 启动不起来,出现以下错误: JVM terminated. Exit code=-1-Xms4 ...

  9. 【转】一个Java对象到底占多大内存?

    最近在读<深入理解Java虚拟机>,对Java对象的内存布局有了进一步的认识,于是脑子里自然而然就有一个很普通的问题,就是一个Java对象到底占用多大内存? 在网上搜到了一篇博客讲的非常好 ...

随机推荐

  1. 【HDOJ1811】【并查集预处理+拓扑排序】

    http://acm.hdu.edu.cn/showproblem.php?pid=1811 Rank of Tetris Time Limit: 1000/1000 MS (Java/Others) ...

  2. itcast-spring-三大框架整合

    三大框架架构(整合原理) struts整合到spring   hibernate整合到spring 导包 eclipse需要导入   myeclipse不用 单独配置spring容器 单独配置stru ...

  3. python使用dns轮循检测web服务器是否异常

    我使用的是python2.7,我本来另装了一个python3.6,发现无法安装dnspython,于是只能换回来了 import dns.resolver #这个需要另外下载并安装(下载地址www.d ...

  4. 利用反射C#获取事件列表

    在程序设计中有时候需要动态订阅客户自己的事件,调用完成后又要删除以前订阅的事件.因为如果不删除,有时会造成事件是会重复订阅,导致程序运行异常.一个办法是用反射来控件事件列表.清空方法代码如下: /// ...

  5. CentOS6.5下安装Apache2.4+PHP7

    CentOS6.5下安装Apache2.4+PHP7 http://blog.csdn.net/along602/article/details/42695779 http://www.th7.cn/ ...

  6. oracle-null和默认值

    Oracle的默认值处理要当心,如果应用中使用的是ORM工具,则必须要考虑对于字段为Null的处理,必要时在ORM工具中将Null转换为default或插入时去掉值为Null的字段. 可以将下面的系统 ...

  7. 手动部署etcd-2018-0731

    手动部署很简单,这里花了10分钟搞定 部署etcd 3台机器 etcd:由于 raft 算法的特性,集群的节点数必须是奇数 [root@linux-node1 ~]# cat /etc/hosts 1 ...

  8. 混合pyqt和qtcreator (2): Impl a image viewer (can show FIji ROI manager data)

    # -*- coding: utf-8 -*- """ Simple demonstration of TreeWidget, which is an extension ...

  9. HBase源码分析之WAL

    WAL(Write-Ahead Logging)是数据库系统中保障原子性和持久性的技术,通过使用WAL可以将数据的随机写入变为顺序写入,可以提高数据写入的性能.在hbase中写入数据时,会将数据写入内 ...

  10. webpack 打包产生的文件名中,hash、chunkhash、contenthash 的区别

    table th:first-of-type { width: 90px; } hash 类型 区别 hash 每一次打包都会生成一个唯一的 hash chunkhash 根据每个 chunk 的内容 ...