前言:

性能优化是一个老生常谈的话题,典型的性能问题如页面响应慢、接口超时,服务器负载高、并发数低,数据库频繁死锁等。尤其是在“糙快猛”的互联网开发模式大行其道的今天,随着系统访问量的日益增加和代码的臃肿,各种性能问题开始纷至沓来。

在系统层面能够影响应用性能的一般包括三个因素:CPU、内存和IO,今天,我们先谈谈CPU性能的监控以及调优。

CPU性能监控

当程序响应变慢的时候,首先使用top、vmstat、ps等命令查看系统的cpu使用率是否有异常,从而可以判断出是否是cpu繁忙造成的性能问题。

其中,主要通过us(用户进程所占的%)这个数据来看异常的进程信息。当us接近100%甚至更高时,可以确定是cpu繁忙造成的响应缓慢。一般说来,cpu繁忙的原因有以下几个:

  • 线程中有无限空循环、无阻塞、正则匹配或者单纯的计算

  • 频繁的gc

  • 多线程频繁的上下文切换

top命令

 

top命令

对于多个或多核cpu,上面的显示则会是多个cpu所占用的百分比总合。如需查看每个核的消耗情况,可在进入top视图后按1,就会按核来显示cpu的使用情况,如上图。

  • us 表示用户进程处理所占的百分比

  • sy 表示为内核线程处理所占的百分比

  • ni 表示被nice命令改变优先级的任务所占的百分比

  • id 表示cpu的空闲时间所占的百分比

  • wa 表示为在执行过程中等待io所占的百分比

  • hi 表示为硬件中断所占的百分比

  • si 表示为软件中断所占的百分比

  • st 表示虚拟cpu等待实际cpu的时间的百分比

vmstat

 

vmstat命令

  • in 每秒CPU的中断次数,包括时间中断

  • cs 每秒上下文切换次数,这个值要越小越好,太大了,要考虑调低线程或者进程的数目。每次调用系统函数,我们的代码就会进入内核空间,导致上下文切换,这个是很耗资源,也要尽量避免频繁调用系统函数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换,导致CPU干正经事的时间少了,CPU没有充分利用,是不可取的。

  • us 用户CPU时间。

  • sy 系统CPU时间,如果太高,表示系统调用时间长,例如是IO操作频繁。

  • id 空闲 CPU时间,一般来说,id + us + sy = 100,一般我认为id是空闲CPU使用率,us是用户CPU使用率,sy是系统CPU使用率。

  • wt 等待IO CPU时间。

gstat -gcutil

 

如果发现是Java进程CPU占用过高,可以使用这个命令查看进程是不是正在频繁GC,如下图所示。

jstat命令

  • S0 — Heap上的 Survivor space 0 区已使用空间的百分比

  • S1 — Heap上的 Survivor space 1 区已使用空间的百分比

  • E — Heap上的 Eden space 区已使用空间的百分比

  • O — Heap上的 Old space 区已使用空间的百分比

  • P — Perm space 区已使用空间的百分比

  • YGC — 从应用程序启动到采样时发生 Young GC 的次数

  • YGCT– 从应用程序启动到采样时 Young GC 所用的时间(单位秒)

  • FGC — 从应用程序启动到采样时发生 Full GC 的次数

  • FGCT– 从应用程序启动到采样时 Full GC 所用的时间(单位秒)

  • GCT — 从应用程序启动到采样时用于垃圾回收的总时间(单位秒)

问题分析

 

根据上面提供的几个常用命令,定位到问题以后,就可以根据具体问题分析其产生的原因了。

CPU瓶颈表现在两个方面:用户态CPU瓶颈和系统态CPU瓶颈。运行操作系统内核以外的软件时导致的瓶颈为用户态CPU瓶颈,运行操作系统内核的时候导致的瓶颈为系统态CPU瓶颈。

用户态CPU和系统态CPU时间比率在3:1到4:1之间是正常的。如果在有瓶颈的系统中,用户和系统时间比率高于这个区间,就应该分析用户态CPU时间增加的原因。

us过高

 

当us值过高时,表示运行的应用消耗了大部分的cpu。在这种情况下,对于java应用而言,最重要的是找到具体消耗cpu的线程所执行的代码,可以采用如下方法。

1.使用gstat -gcutil查看JVM是否频繁的进行GC。
2.如果根据gcutil查看,GC并不频繁,请根据《当CPU飙高时,它在做什么》提供的方式,查看CPU在执行什么代码,来定位问题。

sy过高

 

当sy值过高时,使用vmstat来查看线程切换次数。很可能是linux花费了更多的时间在进行线程切换。java应用造成这种现象的主要原因是启动的线程比较多, 且这些线程多处于不断的阻塞(例如锁等待,io等待)和执行状态的变化过程中,这就导致了操作系统要不断的切换执行的线程, 产生大量的上下文切换。

在这种情况下,对java应用而言,最重要的是找出不断切换状态的原因, 可采用的方法为通过kill -3 pid 或jstack -l pid的方法dump出java应用程序的线程信息,查看线程的状态信息以及锁信息, 找出等待状态或锁竞争过多的线程。

CPU调优

设置程序执行的优先级

 

可以使用nice和renice设置程序执行的优先级。

格式:nice [-n 数值] 命令nice 指令可以改变程序执行的优先权等级。指令让使用者在执行程序时,指定一个优先等级,称之为 nice 值。 这个数值从最高优先级的-20到最低优先级的19。

负数值只有 root 才有权力使。 一般使用者,也可使用 nice 指令來做执行程序的优先级管理,但只能将nice值越调越高。

使用ulimit限制cpu占用时间

 

注意,ulimit 限制的是当前shell进程以及其派生的子进程。因此可以在脚本中调用ulimit来限制cpu使用时间。 例如,限制tar的cpu占用时间,单位秒。

如果tar占用时间超过了100秒,tar将会退出,这可能会导致打包不完全,因此不推荐使用ulimit对cpu占用时间进行限制。 另外,通过修改系统的/etc/security/limits配置文件,可以针对用户进行限制。

使用程序自带的对cpu使用调整的功能

 

某些程序自带了对cpu使用调整的功能,比如nginx服务器,通过其配置文件,可以为工作进程指定cpu,如下:

这里0001 0010 0100 1000是掩码,分别代表第1、2、3、4颗cpu核心,这就使得cpu的使用比较平均到每个核心上。

使用Nginx时,这种优化方式是比较常见的。

阅读原文

Linux系统CPU的性能监控及调优的更多相关文章

  1. <JVM下篇:性能监控与调优篇>03-JVM监控及诊断工具-GUI篇

    笔记来源:尚硅谷JVM全套教程,百万播放,全网巅峰(宋红康详解java虚拟机) 同步更新:https://gitee.com/vectorx/NOTE_JVM https://codechina.cs ...

  2. <JVM下篇:性能监控与调优篇>01-概述篇-02-JVM监控及诊断工具-命令行篇

    笔记来源:尚硅谷JVM全套教程,百万播放,全网巅峰(宋红康详解java虚拟机) 同步更新:https://gitee.com/vectorx/NOTE_JVM https://codechina.cs ...

  3. Java虚拟机性能监控与调优实战

    From:  https://c.m.163.com/news/a/D7B0C6Q40511PFUO.html?spss=newsapp&fromhistory=1 Java虚拟机性能监控与调 ...

  4. JAVA性能监控与调优参考文档链接

    JAVA性能监控与调优参考文档链接 jdk8工具集 https://docs.oracle.com/javase/8/docs/technotes/tools/unix/index.htmlTroub ...

  5. Java生产环境下性能监控与调优详解

    1:JVM字节码指令与 javapjavap <options> <classes>cd monitor_tuning/target/classes/org/alanhou/m ...

  6. Java生产环境下性能监控与调优详解视频教程 百度云 网盘

    集数合计:9章Java视频教程详情描述:A0193<Java生产环境下性能监控与调优详解视频教程>软件开发只是第一步,上线后的性能监控与调优才是更为重要的一步本课程将为你讲解如何在生产环境 ...

  7. <JVM下篇:性能监控与调优篇>补充:浅堆深堆与内存泄露

    笔记来源:尚硅谷JVM全套教程,百万播放,全网巅峰(宋红康详解java虚拟机) 同步更新:https://gitee.com/vectorx/NOTE_JVM https://codechina.cs ...

  8. <JVM下篇:性能监控与调优篇>补充:使用OQL语言查询对象信息

    笔记来源:尚硅谷JVM全套教程,百万播放,全网巅峰(宋红康详解java虚拟机) 同步更新:https://gitee.com/vectorx/NOTE_JVM https://codechina.cs ...

  9. Linux、Windows如何进行性能监控与调优

    1.Linux命令行工具 推荐:CentOS 7 1.1 top命令 top命令的输出如下: top命令的输出可以分为两部分:前半部分是系统统计信息,后半部分是进程信息.在统计信息中, 第1行是任务队 ...

随机推荐

  1. ios8 xcode6 下的启动界面设置和图标设置

    IOS8 我试了网上不少设置启动动画的,不知道是不是我弄错了还是怎么的,反正启动不了,后来在code4论坛找到了这个: 启动屏幕:LaunchScreen.xib文件 桌面图标等相关app图片:Ima ...

  2. 【.NET中AOP的实现方案】静态代理

    Spring AOP 应该是比较出名的了,今天说的是C#里的AOP,C#的AOP实现的方式有很多种,现在就先介绍静态代理的实现方案: 模拟场景:我们在删除用户,或者更新用户的时候进行数据原始备份,这样 ...

  3. code[VS] 1048 石子归并

    题目描写叙述 Description 有n堆石子排成一列,每堆石子有一个重量w[i], 每次合并可以合并相邻的两堆石子.一次合并的代价为两堆石子的重量和w[i]+w[i+1]. 问安排如何的合并顺序, ...

  4. rarcrack

    apt-get install rarcrack使用方法:rarcrack --threads xx --type rar xx.rar

  5. UsageGrideReport++

      迁移时间:2017年5月20日11:42:02CreateTime--2016年9月29日15:46:15Author:Marydon版本Gride Report++6.0使用说明:参考链接:ht ...

  6. uva 699 The Falling Leaves(建二叉树同一时候求和)

    本来看着挺难的.大概是由于我多瞟了一眼题解,瞬间认为简单多了.做题就得这样,多自己想想.如今是 多校联赛,然而我并不会做. .. .慢慢来,一直在努力. 分析: 题上说了做多不会超过80行.所以能够开 ...

  7. 【Docker】安装tomcat并部署应用

    安装tomcat 1.拉取tomcat镜像 docker pull docker.io/tomcat 查看镜像 docker images 2.启动tomcat 首先添加8090端口:firewall ...

  8. Hystrix的一个坑,queue中的run方法没有被执行?

    今天学的时候随手测了一下Hystrix的queue的异步执行,发现执行queue之后,还没有打印run方法中的内容,程序就结束了: import com.netflix.hystrix.Hystrix ...

  9. linux 系统文件的特殊权限

    文件权限与归属 Linux系统中的一切都是文件,但每个文件的类型不尽相同,并且Linux系统会用不同的符号来加以区分,常见的包括有 -:普通文件,d:目录文件,l:链接文件,b:块设备文件,c:字符设 ...

  10. Hex棋

    Hex棋,又叫六角棋,译作海克斯棋.据说这个游戏是约翰·纳什发明的.网上并没有太多介绍,第一次听说是在"中国大学生计算机博弈大赛"官网上. 棋盘为11×11的六边形小格子组成,它是 ...