性能调优之Java系统级性能监控及优化
性能调优之Java系统级性能监控及优化
对于性能调优而言,通常我们需要经过以下三个步骤:1,性能监控;2,性能剖析;3,性能调优
我们对于操作系统的性能关注主要在下面几个点上:CPU 利用率、CPU 调度执行队列、内存利用率、网络 I/O、磁盘I/O。
1.CPU 利用率
对于一个应用来说,为了让应用达到最好的性能和可扩展性,我们不仅仅要充分利用 CPU 周期内可用的部分,而且要让这部分 CPU 的使用更有价值,而不是浪费。能够让 CPU 的周期利用的更充分对于多线程应用运行在多处理器和多核系统上至很有挑战性的。另外,当 CPU 达到饱和状态的时候并不能说明 CPU 的性能和伸缩性已经达到了最佳的状态。
为了区分应用是如何利用 CPU 资源的,我们必须从操作系统级别来检测。在很多操作系统上,CPU 的利用率统计报告通常包括用户和系统或内核对操作系统的使用。用户对 CPU 的使用是指应用用来执行应用代码执行所需要的时间。相比之下,内核和系统对 CPU 的使用是指应用用来执行操作系统内核代码锁花费的时间。高的内核或者系统 CPU 使用率可以表明共享资源紧迫,或者是有大量的 I/O 设备交互。理想的状态为了提高应用的性能和伸缩性,让内核或系统 CPU 时间为 0%,因为花在执行内核或系统代码的时间是可以用来执行应用代码的。因此 CPU 使用优化的一个正确方向就是尽可能减少 CPU 花在执行内核代码或者系统代码上的时间。
对于计算密集型应用,性能监控比监测用户 CPU 使用和内核或系统 CPU 使用要更深层次,在计算密集型应用中,我们需要监测 CPU 时钟周期内的执行执行条数(Instructions per clock;IPC),或者是每条 CPU 执行所使用的CPU周期(cycles per instruction;CPI)。对于计算密集型应用来说我们从这两个维度来监测 CPU 是不错的选择,因为现代操作系统的打包 CPU 性能报告工具通常只会打印 CPU 的利用率,而不会打印 CPU 周期内 CPU 用来执行指令的时间。这意味着当 CPU 正在等待内存中的数据的时候,操作系统CPU性能报告工具也会认为 CPU 是正在使用的状态,我们把这个场景叫做「Stall」,这种场景经常会发生,比如在 CPU 正在执行指令的任何时候,只要是指令需要的数据没有准备好,也就是没有在寄存器或者CPU缓存内,都会发生「Stall」场景。
当「Stall」场景发生的时候 CPU 会浪费时钟周期,因为 CPU 必须要等待指令需要的数据到达寄存器或者缓冲器。而且在这个场景中,数百个 CPU 时钟周期被浪费是很正常的事情,因此在计算密集型应用中,提高性能的策略是减少「Stall」场景的发生或者是增强 CPU 的缓存使用从而使得更少的 CPU 周期因为等待数据而浪费掉。这类的性能监控知识已经超越了本书的内容,需要性能专家的帮助了。然而,后面讲到的 Oracle Solaris Studio Performance Analyzer 这种性能剖析工具将会包括此类数据。
2.CPU 调度队列
除了对 CPU 使用的监控,我们也可以通过监控 CPU 执行队列来检查系统是否已经满负载。执行队列是用来存储轻量级进程,这些进程通常是已经准备好执行了但是正在等待 CPU 调度而在调度队列等待的一种状态,当轻量级进程别当前处理器能来得及处理的数量更多的时候,调度队列将会产生。比较深的 CPU 调度队列表明系统已经满负荷了。系统的执行队列深度等于虚拟处理器执行不了的等待数,虚拟处理器数等于系统的硬件线程数。我们可以用 JAVA 的 API 来拿到虚拟处理器数。
Runtime.avaliableProcessors()。当执行队列深度大于虚拟处理器个数的四倍或更多的时候,操作系统将会出现反应迟钝的现象。
对于 CPU 调度队列的检测的一个通用指导是当我们发现队列深度高于虚拟进程数一倍的时候就要注意了,但是没有必要立即采取行动。当大于三倍或四倍或者更高的时候就要注意了,解决问题刻不容缓。
通常有两个可选的途径来观察队列的深度,第一个是通过增加 CPU 来分担负载或者减少对现有 CPU 的负载。这种途径从本质上减少了每个执行单元的负载线程数,从而减少执行执行队列的深度。
另外的一种途径是通过剖析系统运行的应用来增加 CPU 的使用率,换个说法就是寻找一种可以减少花费在垃圾回收上的 CPU 周期,或者寻找更好的算法来以更少的 CPU 周期来执行 CPU 指令。性能专家通常专注后面的一种途径:减少代码的执行路径长度和更好的 CPU 指令选择。Java 程序员可以通过更好的执行算法和数据结构来提高代码的执行效率。
3.内存利用率
其实,除了 CPU 的使用率,系统的内存属性也需要被监控,这些属性包括比如:分页、交换、锁、多线程引起的上下文交换等。
交换通常发生在当应用需要的内存大于实际的物理内存的时候,处理这种情况操作系统通常会配置一个相应的区域叫做交换区。交换区通常位于物理磁盘上,当物理内存内应用耗尽的时候,操作系统会将一部分内存数据暂时交换到磁盘空间上,这部分内存区域通常是访问频率最低的一块区域,而不会影响比较「忙」的内存区域;当被交换到磁盘区域的内存又被应用访问的时候,这个时候就需要从磁盘交换区将以页为单位读入内存,交换会影响应用的性能。
虚拟机的垃圾收集器在交换的时候性能非常差,因为垃圾收集器所访问的大部分区域都是不可达的,也就是垃圾收集器会引起交换活动的发生。场景是戏剧性的,如果垃圾收集的堆区域已经被交换到了磁盘空间,这个时候将会以页为单位发生交换,这样才能够被垃圾收集器所扫描到,在交换的过程中会戏剧性的引发垃圾收集器的收集时间延长,这个时候如果垃圾收集器是 「Stop The World」(使得应用响应停止)的,那么这个时间就会被延长。
4.网络 I/O
分布式 Java 应用的性能和伸缩性会受到网络带宽和网络性能的限制。例如,如果我们往网络接口发送比他能够处理的更多的数据包,数据包将会堆积在操作系统的缓冲区内,这将会引发应用延迟,另外其他的情况也会导致网络应用的延迟。
区分和监控的工具通常在操作系统的打包工具中很难找到。尽管 Linux 提供了 Netstat 命令,Linux 和 Solaris 都提供了网络使用情况的实现,他们都提供了包括每秒发包、接包、错包、冲突等信息的统计。在以太网中,一小部分包冲突是很正常的现象。如果错包情况比较多那可能是网卡有问题了。同时,尽管 netstat 可以统计网络接口的发送和接收数据情况,这很难断定网卡是否被充分利用。例如,如果 Netstat -i 显示现在每秒有 2500 个包从网卡发出,但是我们仍然无法判断当前的网络利用率是 100% 还是 1%,我们仅仅能够知道目前有流量。这仅仅是在不知道网络包大小的情况下能够得到的结论。简单的说我们无法通过 Linux 和 Solaris 提供的 Netstat 来判断当前网络是否影响了性能。我们需要一些其他的工具在我们的 Java 应用运行的过程中来监测网络。
5.磁盘 I/O
如果应用有对磁盘进行操作,我们需要对磁盘进行监控,来监测可能出现的磁盘性能问题。一些应用是 I/O 密集型的,比如数据库。磁盘的使用通常还存在于应用日志系统,日志通常是我们用来记录系统运行过程中重要信息的。
性能调优之Java系统级性能监控及优化的更多相关文章
- 剑指Offer——知识点储备-故障检测、性能调优与Java类加载机制
剑指Offer--知识点储备-故障检测.性能调优与Java类加载机制 故障检测.性能调优 用什么工具可以查出内存泄露 (1)MerroyAnalyzer:一个功能丰富的java堆转储文件分析工具,可以 ...
- 故障检测、性能调优与Java类加载机制
故障检测.性能调优与Java类加载机制 故障检测.性能调优 用什么工具可以查出内存泄露 (1)MerroyAnalyzer:一个功能丰富的java堆转储文件分析工具,可以帮助你发现内存漏洞和减少内存消 ...
- 性能调优之访问日志IO性能优化
性能调优之访问日志IO性能优化 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.如果对课程感兴趣,请大家咨询qq:908821 ...
- OCM_第十五天课程:Section6 —》数据库性能调优 _SQL 访问建议 /SQL 性能分析器/配置基线模板/SQL 执行计划管理/实例限制
注:本文为原著(其内容来自 腾科教育培训课堂).阅读本文注意事项如下: 1:所有文章的转载请标注本文出处. 2:本文非本人不得用于商业用途.违者将承当相应法律责任. 3:该系列文章目录列表: 一:&l ...
- Java性能调优:利用JMC分析性能
Java性能调优作为大型分布式系统提供高性能服务的必修课,其重要性不言而喻. 好的分析工具能起到事半功倍的效果,利用分析利器JMC.JFR,可以实现性能问题的准确定位. 本文主要阐述如何利用JMC分析 ...
- Java性能调优:利用JFR生成性能日志
Java性能调优作为大型分布式系统提供高性能服务的必修课,其重要性不言而喻. 好的分析工具能起到事半功倍的效果,利用分析利器JMC.JFR,可以实现性能问题的准确定位. 本文主要阐述如何利用JFR生成 ...
- 性能调优3:硬盘IO性能
数据库系统严重依赖服务器的资源:CPU,内存和硬盘IO,通常情况下,内存是数据的读写性能最高的存储介质,但是,内存的价格昂贵,这使得系统能够配置的内存容量受到限制,不能大规模用于数据存储:并且内存是易 ...
- Tomcat 性能调优 出现java.lang.OutOfMemoryError: PermGen space
Tomcat 在部署应用中,Server报错:java.lang.OutOfMemoryError: PermGen space,问题就是Tomcat内存分配的太小了. 解决办法 1: 修改Tomca ...
- 图灵学院Java架构师-VIP-【性能调优-Mysql索引数据结构详解与索引优化】
最近报名了图灵学院的架构专题的付费课程,没有赶上6月份开课,中途加入的.错过了多线程的直播课程,只能看录播了
随机推荐
- jQuery中.bind() .live() .delegate() .on()的区别 和 三种方式写光棒事件 动画
地狱的镰刀 bind(type,[data],fn) 为每个匹配元素的特定事件绑定事件处理函数. $("a").bind("click",function(){ ...
- 自己写的python脚本(抄的别人的,自己改了改,用于整理大量txt数据并插入到数据库)
昨天,遇到了一个问题,有100w条弱口令数据,需要插入到数据库中,而且保存格式为txt. 身为程序员不可能一条一条的去写sql语句吧(主要是工作量太大,我也懒得干).所以,我 就百度了一下,看有没有相 ...
- 实际情况来看,还是yield很爽
0 引言 最近公司有一个 php 的项目,要 port 到 node.js 来.我之前没有接触过这个项目,整个项目使用的是 yaf 框架.整个项目流程是调用服务端的业务数据,然后拼装数据,返回给前端: ...
- Linux 压缩解压及备份命令
linux中压缩与备份命令总结一.压缩与解压缩 1.compress [-rcv] 文件或目录 <==压缩 uncompress 文件.Z <==解压缩 -r:可以连同目录下的文件也同时进 ...
- 第八讲:I/O虚拟化
一.I/O虚拟化的产生 服务器单个千兆以太网端口肯定能够支持单个应用,但是当被分割为10个.15个或者更多的服务器负载时(这其中包括网络.存储以及服务器之间的流量)可能就不够用了. 当遇到I/O瓶颈时 ...
- WEB标准了解
今天看到朋友的简历有一项“了解WEB标准”,就特地了解了一下什么是WEB标准.现在就一项一项地解开自己的疑惑. 1.什么是WEB标准 WEB标准大部分由万维网组织(W3C)制定的WEB程序开发规范.W ...
- Redis安装以及基本数据类型
安装 1.阿里云CentOS 1.进入到centos系统,输入wget http://download.redis.io/releases/redis-3.2.8.tar.gz ,下载好目前最新版的R ...
- 咖啡师之路:第一日一杯Espresso
代码敲累了.产品要发布了.熬夜啊加班啊. 精神完全不在状态. 咋办--- 咋办--- 咋办---! 来一杯Espresso浓缩咖啡.各位码农,码神们的必备良品! 咖啡每天要2-3杯,不管是速溶还是现磨 ...
- MySQL学习分享-->查询-->查询的原理
查询的原理 在一个查询中常包含下述子句: 1.select,2.distinct,3.join,4.on,5.from,6.where,7.having,8.group by,9.order by,1 ...
- 去掉标题栏的方法(使用requestWindowFeature(Window.FEATURE_NO_TITLE);为什么失效)
使用requestWindowFeature(Window.FEATURE_NO_TITLE)隐藏标题栏失效的原因,可能是activity继承的是AppCompatActivity.下面详细介绍了使用 ...