关键词:top、perf、sar、ksar、mpstat、uptime、vmstat、pidstat、time、cpustat、munin、htop、glances、atop、nmon、pcp-gui、collectl。

1. top

top是最常用的查看系统资源使用情况的工具,包括CPU、内存等等资源。

这里主要关注CPU资源。

1.1 /proc/loadavg

load average取自/proc/loadavg。

9.53 9.12 8.37 3/889 28165

前三个数字是1、5、15分钟内进程队列中平均进程数,包括正在运行的进程+准备好等待运行的进程。

第四个数字分子表示正在运行的进程数,分母是进程总数。

最后一个数字是最近运行的进程ID号。

其中top取的是/proc/loadavg的前三个数。

1.2 top使用

打开top,可以指定更新的周期。

输入H,打开隐藏的线程;输入1,可以显示单核CPU使用情况。

top -H -b -d 1 -n 200 > top.txt,每个1秒统计一次,共200次,显示线程细节,并保存到top.txt中。

top采样来源你还依赖于/proc/stat和/proc/<pid>/stat两个,这两个的详细介绍参考:/proc/stat/proc/<pid>/stat

其中CPU信息对应的含义如下:

us是user的意思,统计nice小于等于0的用户空间进程,也即优先级为100~120。

ni是nice的意思,统计nice大于0的用户空间进程,也即优先级为121~139。

sys是system的意思,统计内核态运行时间,不包括中断。

id是idle的意思,几系统处于空闲态。

wa是iowait的意思,统计io等待时间。

hi是hardware interrupt,统计硬件中断时间。

si是software interrupt,统计软中断时间。

最后的st是steal的意思。

2. perf

系统级性能分析工具perf的介绍与使用》有关于perf使用的详细介绍,这里重点关注CPU占用率。

通过sudo perf top -s comm,可以查看当前系统运行进程占比。

这里不像top一样区分idle、system、user,这里的占比是各个进程在总运行时间里面占比。

通过sudo perf record记录采样信息,然后通过sudo perf report -s comm。

3. sar、ksar

sar是System Activity Report的意思,可以用于实时观察当前系统活动,也可以生成历史记录的报告。

要使用sar需要安装sudo apt install sysstat,然后对sysstat进行配置。

sar用于记录统计信息,ksar用于将记录的信息图形化输出。

ksar下载地址在:https://github.com/vlsi/ksar/releases

sudo gedit /etc/default/sysstat--------------------------------将 ENABLED=“false“ 改为ENABLED=“true“。

sudo gedit /etc/cron.d/sysstat--------------------------------修改sar的周期等配置。

sudo /etc/init.d/sysstat restart--------------------------------重启sar服务

/var/log/sysstat/--------------------------------------------------sar log存放目录

使用sar记录开机到目前的统计信息到文件sar.txt。

LC_ALL=C sar -A > sar.txt

PS:这里直接使用sar -A,在ksar中无法正常显示。

如下执行java -jar ksar.jar,然后Data->Load from text file...选择保存的sar.txt文件。

得到如下的图表。

还可以通过sar记录一段时间的信息,指定采样周期和采样次数。

这些命令前加上LC_ALL=C之后保存到文件中,都可以在ksar中图形化显示。

sar 1 100---------------------------------------所有cpu合一的统计信息

sar -P ALL 1 100-----------------------------包括cpu合一以及单个cpu的统计信息

sar -B 1 100-----------------------------------paging统计信息

sar -b 1 100----------------------------------块设备IO统计信息

sar -d 1 100----------------------------------块设备活动统计信息

sar -F 1 100---------------------------------挂载的文件系统统计信息

sar -r ALL------------------------------------显示详细的内存使用统计信息

sar -S----------------------------------------显示swap空间使用情况统计信息

sar -w---------------------------------------显示进程创建以及进程切换统计信息

sar -W--------------------------------------显示swap换入换出统计信息。

更详细请参考《How To Create sar Graphs With kSar To Identifying Linux Bottlenecks》、《Collect and report Linux System Activity Information with sar》。

4. mpstat

mpstat是Multiprocessor Statistics。当没有参数时,mpstat显示系统系统以来所有信息平均值。

常见用法如下,-P ALL监控所有CPU,细节显示特定CPU;10表示每10秒监控一次;20表示监控20次。

mpstat -P ALL 10 20

结果如下:

Linux 4.13.--generic (xxx)     2018年08月13日     _x86_64_    ( CPU)

11时01分09秒  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle
11时01分19秒 all 3.44 6.26 5.15 0.13 0.00 0.20 0.00 0.00 0.00 84.82
11时01分19秒 3.09 13.46 3.29 0.00 0.00 0.10 0.00 0.00 0.00 80.06
11时01分19秒 4.41 3.11 5.02 0.00 0.00 0.60 0.00 0.00 0.00 86.86
11时01分19秒 2.96 0.20 9.29 0.00 0.00 0.10 0.00 0.00 0.00 87.45
11时01分19秒 3.32 7.95 3.12 0.50 0.00 0.00 0.00 0.00 0.00 85.11 11时01分19秒 CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle
11时01分29秒 all 3.65 6.09 5.08 0.00 0.00 0.25 0.00 0.00 0.00 84.93
11时01分29秒 3.92 11.07 4.63 0.00 0.00 0.20 0.00 0.00 0.00 80.18
11时01分29秒 4.39 1.90 3.49 0.00 0.00 0.80 0.00 0.00 0.00 89.42
11时01分29秒 3.35 0.10 10.14 0.00 0.00 0.00 0.00 0.00 0.00 86.41
11时01分29秒 2.91 11.26 2.21 0.00 0.00 0.00 0.00 0.00 0.00 83.62

usr表示用户空间进程,nice表示nice值大于0的用户空间进程。

sys是内核空间,iowait是I/O等待时间,irq是硬中断,soft是软中断,idle是空闲时间,guest和gnice都是虚拟机时间。

5. uptime

uptime是一个简单获取系统总共运行多长时间,以及最近1分钟、5分钟、15分钟的平均负载。

uptime通过/proc/uptime和/proc/loadavg获取相关信息。

up前是当前系统时间,up后是系统运行时长。

load average后是1分钟、5分钟、15分钟平均负载。

:: up  days, :,   users,  load average: 0.28, 0.40, 0.43

6. vmstat

vmstat主要用于监控系统内存使用情况的工具,但是也包含一些CPU相关信息。

使用方法vmstat 5 5表示运行5次,每次5秒。结果如下:

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st

上面的参数可以分为6大部分:进程、内存、swap、io、中断和进程切换、cpu。

更加详细的解释:

参考文档:《Linux Performance Measurements using vmstat

7. pidstat

pidstat主要用于监控全部或指定进程占用系统资源的情况。

7.1 查看CPU使用情况

pidstat首次运行时显示自系统启动开始的各项统计信息,之后运行pidstat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所需的统计信息。

pidstat -p ALL---------------------------显示所有的进程统计信息,包括idle进程。

pidstat -p ALL -t------------------------更加详细的显示了线程统计信息。

pidstat [option] interval [count]-----周期采样和采样次数

除此之外还可以通过-p获取指定进程的统计信息。

pidstat还可以通过-r获取内存使用统计信息,通过-d获取IO使用统计信息。

7.2 查看内存使用情况

pidstat -p ALL -r结果如下:

15时18分21秒   UID       PID  minflt/s  majflt/s     VSZ     RSS   %MEM  Command
15时18分21秒 0.02 0.00 0.08 systemd
15时18分21秒 0.00 0.00 0.00 kthreadd
15时18分21秒 0.00 0.00 0.00 kworker/:0H
15时18分21秒 0.00 0.00 0.00 mm_percpu_wq
15时18分21秒 0.00 0.00 0.00 ksoftirqd/
15时18分21秒 0.00 0.00 0.00 rcu_sched

minflt/s: 每秒次缺页错误次数(minor page faults),次缺页错误次数意即虚拟内存地址映射成物理内存地址产生的page fault次数。

majflt/s: 每秒主缺页错误次数(major page faults),当虚拟内存地址映射成物理内存地址时,相应的page在swap中,这样的page fault为major page fault,一般在内存使用紧张时产生。

VSZ: 该进程使用的虚拟内存(以kB为单位)。

RSS: 该进程使用的物理内存(以kB为单位)。

%MEM: 该进程使用内存的百分比。

Command: 拉起进程对应的命令。

7.3 查看磁盘使用情况

pidstat -p ALL -d结果如下:

15时20分40秒   UID       PID   kB_rd/s   kB_wr/s kB_ccwr/s iodelay  Command
15时20分40秒 -1.00 -1.00 -1.00 systemd
15时20分40秒 -1.00 -1.00 -1.00 kthreadd
15时20分40秒 -1.00 -1.00 -1.00 kworker/:0H
15时20分40秒 -1.00 -1.00 -1.00 mm_percpu_wq
15时20分40秒 -1.00 -1.00 -1.00 ksoftirqd/
15时20分40秒 -1.00 -1.00 -1.00 rcu_sched

kB_rd/s: 每秒进程从磁盘读取的数据量(以kB为单位)。

kB_wr/s: 每秒进程向磁盘写的数据量(以kB为单位)。

kB_ccwr/s:每秒进程被取消向磁盘写的数据量(以kB为单位)。

Command: 拉起进程对应的命令。

8. time

time命令可以被用于统计指定程序的CPU耗时。

比如time cksum nomachine_6.0.80_1.exe得到如下结果。

  nomachine_6..80_1.exe

real    0m0.263s-----------------整个操作总耗时,0.263-0.094-0.011=0.158是IO等待耗时。
user 0m0.094s-----------------用户态耗时
sys 0m0.011s------------------内核态耗时
nomachine_6..80_1.exe real 0m0.098s-----------------第二次执行就可以看出等待IO操作的时间基本上没有了。
user 0m0.097s
sys 0m0.000s

9. cpustat

通过sudo apt install cpustat安装,cpustat -T -D -x结果如下。

Load Avg 0.66 0.54 0.49, Freq Avg. 1.46 GHz,  CPUs online------------------------------显示Load Avg信息和平均频率等。
3791.1 Ctxt/s, 1709.9 IRQ/s, 1800.0 softIRQ/s, 0.0 new tasks/s, running, blocked----进程切换次数、硬中断、软中断等等统计信息。
%CPU %USR %SYS PID S CPU Time Task-------------------------------------------CPU占用率、用户空间和内核空间占用率等。
25.74 25.74 0.00 R .29w /usr/bin/python3
15.84 15.84 0.00 S .49w /usr/lib/xorg/Xorg
10.89 9.90 0.99 S .05w compiz
7.92 0.00 7.92 S .60s [kworker/:]
0.99 0.00 0.99 R .01s cpustat
0.99 0.99 0.00 S .20h compiz
0.99 0.99 0.00 S .76h /usr/NX/bin/nxnode.bin
0.99 0.00 0.99 S 1.24m [kworker/:]
64.36 53.47 10.89 Total Load Avg 0.66 0.54 0.49, Freq Avg. 1.75 GHz, CPUs online
2834.8 Ctxt/s, 1190.9 IRQ/s, 1183.3 softIRQ/s, 0.0 new tasks/s, running, blocked
%CPU %USR %SYS PID S CPU Time Task
25.76 25.76 0.00 R .29w /usr/bin/python3
18.18 18.18 0.00 S .49w /usr/lib/xorg/Xorg
7.58 7.58 0.00 S .05w compiz
6.06 0.00 6.06 S .64s [kworker/:]
1.52 0.00 1.52 R .02s cpustat
1.52 0.00 1.52 S .00h [rcu_sched]
1.52 0.00 1.52 S 1.16m update-notifier
62.12 51.52 10.61 Total Distribution of CPU utilisation (per Task):
% CPU Utilisation Count (%)
0.00 - 1.97 98.88
1.97 - 3.94 0.00
3.94 - 5.91 0.00
5.91 - 7.88 0.28
7.88 - 9.85 0.00
9.85 - 11.82 0.00
11.82 - 13.79 0.14
13.79 - 15.76 0.00
15.76 - 17.73 0.14
17.73 - 19.70 0.14
19.70 - 21.67 0.00
21.67 - 23.64 0.00
23.64 - 25.61 0.28
25.61 - 27.57 0.00
27.58 - 29.54 0.00
29.55 - 31.51 0.00
31.52 - 33.48 0.00
33.48 - 35.45 0.00
35.45 - 37.42 0.00
37.42 - 39.39 0.14 Distribution of CPU utilisation (per CPU):----------------------------------------------各CPU占用率,分用户空间和内核空间。
CPU# USR% SYS%
17.37 1.20
8.98 2.40
0.60 7.19
25.75 0.00

10.  htop

htop和top的功能类似,但是可读性比top更好。在界面按下F5,可以看到进程里面的线程,树形结构表示了父子关系。

11. atop

atop是一个监控系统资源和进程的工具。它通过CPU使用率来对列表中的进程进行降序排列,而每一个进程则包含了CPU、内存、磁盘和网络状态等信息。它的功能与top和htop类似。

12. glances

glances是一个由python编写的,与Nmon功能类似的报告工具,它能够报告统计cpu、内存、网络、磁盘和进程。除了报告统计,glances不支持任何其他特性或功能。当程序运行时点击“h”可以显示帮助页面。

13. nmon

Nmon是一个非常容易使用,能够在一个屏幕上监视CPU、内存、网络、磁盘使用状况和进程列表的工具。除了无法管理进程和修改报告显示,Nmon与那些只用于报告的报告工具完全一样。另外,它可以将数据保存到电子表格文件。

13. pcp-gui

Performance Co-Pilot,简称PCP,是一个系统性能和分析框架。它从多个主机整理数据并实时的分析,帮你识别不正常的表现模式。它也提供API让你设计自己的监控和报告解决方案。

安装pcp相关工具。

sudo apt install pcp pcp-gui

File->Open View选择需要打开的视图,比如CPU、Disk、Memory等。

14. collectl、colplot

14.1 collectl使用

collectl是一款非常优秀并且有着丰富的命令行功能的实用程序,你可以用它来采集描述当前系统状态的性能数据。

不同于大多数其它的系统监控工具,collectl 并非仅局限于有限的系统度量,相反,它可以收集许多不同类型系统资源的相关信息,如 cpu 、disk、memory 、network 、sockets 、 tcp 、inodes 、infiniband 、 lustre 、memory、nfs、processes、quadrics、slabs和buddyinfo等。

同时collectl还可以替代常用工具,比如top、vmstat、ps、iotop等。

安装collectl:

sudo apt-get install collectl

collectl的使用很简单,默认collectl显示cpu、磁盘、网络信息。

#<----CPU[HYPER]-----><----------Disks-----------><----------Network---------->
#cpu sys inter ctxsw KBRead Reads KBWrit Writes KBIn PktIn KBOut PktOut

collectl还可以显示更多的子系统信息,如果选项存在对应的大写选项,大写选项表示更细节的设备统计信息。

b – buddy info (内存碎片)

c – 所有CPU的合一统计信息;C - 单个CPU的统计信息。

d – 整个文件系统Disk合一统计信息;C - 单个磁盘的统计信息。

f – NFS V3 Data

i – Inode and File System

j – 显示每个CPU的Interrupts触发情况;J - 显示每个中断详细触发情况。

l – Lustre

m – 显示整个系统Memory使用情况;M - 按node显示内存使用情况。

n – 显示整个系统的Networks使用情况;N - 分网卡显示网络使用情况。

s – Sockets

t – TCP

x – Interconnect

y – 对系统所有Slabs (系统对象缓存)使用统计信息;Y - 每个slab使用的详细信息。

collectl --all显示所有子系统的统计信息,包括cpu、终端、内存、磁盘、网络、TCP、socket、文件系统、NFS。

#<----CPU[HYPER]-----><-----------------Int------------------><-----------------Memory-----------------><----------Disks-----------><----------Network----------><-------TCP--------><------Sockets-----><----Files---><------NFS Totals------>
#cpu sys inter ctxsw Cpu0 Cpu1 Cpu2 Cpu3 Cpu4 Cpu5 Cpu6 Cpu7 Free Buff Cach Inac Slab Map Fragments KBRead Reads KBWrit Writes KBIn PktIn KBOut PktOut IP Tcp Udp Icmp Tcp Udp Raw Frag Handle Inodes Reads Writes Meta Comm
4G 107M 1G 640M 151M 1G nlsrkjebaas
4G 107M 1G 640M 151M 1G nlsrkjebaas
4G 107M 1G 640M 151M 1G olsrkjebaas

collectl --top可以代替top命令:

# TOP PROCESSES sorted by time (counters are /sec) ::
# PID User PR PPID THRD S VSZ RSS CP SysT UsrT Pct AccuTime RKB WKB MajF MinF Command
al R 75M 28M 0.02 0.05 :00.47 /usr/bin/perl
al S 1G 181M 0.01 0.03 :48.14 /opt/google/chrome/chrome
al S 955M 215M 0.00 0.04 :30.44 /opt/google/chrome/chrome
al S 923M 135M 0.01 0.03 :24.67 /opt/google/chrome/chrome
al S 710M 60M 0.01 0.01 :12.79 /usr/bin/python

collectl --vmstat可以代替vmstat命令:

#procs ---------------memory (KB)--------------- --swaps-- -----io---- --system-- ----cpu-----
# r b swpd free buff cache inact active si so bi bo in cs us sy id wa
4634M 108M 1535M 642M 481M
4631M 108M 1539M 642M 481M
4623M 108M 1547M 642M 481M

collectl -c1 -sZ -i:1可以代替ps命令。

collectl和一些处理分析数据工具(比如colmux、colgui、colplot)结合能提供可视化图形。

14.2 colplot使用

colplot是collectl工具集的一部分,其将collectl收集的数据在浏览器中图形化展示。

colplot的介绍在此,相关源码可以再collectl-utils下载。

解压下载的colplot之后,sudo ./INSTALL安装colplot。

安装之后重启apache服务:

suod systemctl reload apache2

sudo systemctl restart apache2

在浏览器中输入http://127.0.0.1/colplot/,即可使用colplot。

通过Change Dir选择存放经过collectl -P保存的数据,然后设置Plot细节、显示那些子系统、plot大小等等。

最后Generate Plot查看结果。

参考文档:《Collectl: Linux 性能监控的全能冠军》、《Collectl Documentation》、《Collectl Examples - An Awesome Performance Analysis Tool in Linux

0. 其他

munin、rrdtool

Linux CPU占用率监控工具小结的更多相关文章

  1. Linux CPU占用率监控工具

    关键词:top.perf.sar.ksar.mpstat.uptime.vmstat.pidstat.time.cpustat.munin.htop.glances.atop.nmon.pcp-gui ...

  2. linux CPU占用率高(转)

    来自:http://www.cnitblog.com/houcy/archive/2012/11/28/86801.html 1.用top命令查看哪个进程占用CPU高 gateway网关进程14094 ...

  3. linux top命令中各cpu占用率含义

    linux top命令中各cpu占用率含义 [尊重原创文章摘自:http://www.iteye.com/topic/1137848]0.3% us 用户空间占用CPU百分比 1.0% sy 内核空间 ...

  4. (转)linux top命令中各cpu占用率含义及案例分析

    原文:https://blog.csdn.net/ydyang1126/article/details/72820349 linux top命令中各cpu占用率含义 0 性能监控介绍 1 确定应用类型 ...

  5. Linux下java进程CPU占用率高分析方法

    Linux下java进程CPU占用率高分析方法 在工作当中,肯定会遇到由代码所导致的高CPU耗用以及内存溢出的情况.这种情况发生时,我们怎么去找出原因并解决. 一般解决方法是通过top命令找出消耗资源 ...

  6. Linux下如何查看高CPU占用率线程

    转于:http://www.cnblogs.com/lidabo/p/4738113.html 目录(?)[-] proc文件系统 proccpuinfo文件 procstat文件 procpidst ...

  7. 云服务器 ECS Linux 系统 CPU 占用率较高问题排查思路

    https://help.aliyun.com/knowledge_detail/41225.html?spm=5176.7841174.2.2.ifP9Sc 注意:本文相关配置及说明已在 CentO ...

  8. Linux下如何查看高CPU占用率线程 LINUX CPU利用率计算

    目录(?)[-] proc文件系统 proccpuinfo文件 procstat文件 procpidstat文件 procpidtasktidstat文件 系统中有关进程cpu使用率的常用命令 ps ...

  9. (笔记)Linux下如何查看高CPU占用率线程

    在 Linux 下 top 工具可以显示 cpu 的平均利用率(user,nice,system,idle,iowait,irq,softirq,etc.),可以显示每个 cpu 的利用率.但是无法显 ...

随机推荐

  1. 一文带你学会使用YOLO及Opencv完成图像及视频流目标检测(上)|附源码

    计算机视觉领域中,目标检测一直是工业应用上比较热门且成熟的应用领域,比如人脸识别.行人检测等,国内的旷视科技.商汤科技等公司在该领域占据行业领先地位.相对于图像分类任务而言,目标检测会更加复杂一些,不 ...

  2. linux:终端常用命令 + vi命令修改文件及保存 方法

    首先介绍一下Ubuntu下各个目录的一般作用: /  这就是根目录,一台电脑有且只有一个根目录,所有的文件都是从这里开始的.举个例子:当你在终端里输入“/home”,你其实是在告诉电脑,先从/(根目录 ...

  3. Go语言学习笔记(四) [array、slice、map]

    日期:2014年7月22日   一.array[数组]   1.定义:array 由 [n]<type> 定义,n 标示 array 的长度,而 <type> 标示希望存储的内 ...

  4. Git+Gitlab+Ansible的roles实现一键部署Nginx静态网站(一)--技术流ken

    前言 截止目前已经写了<Ansible基础认识及安装使用详解(一)--技术流ken>,<Ansible常用模块介绍及使用(二)--技术流ken><Ansible剧本介绍及 ...

  5. Logback中使用TurboFilter实现日志级别等内容的动态修改

    可能看到这个标题,读者会问:要修改日志的级别,不是直接修改log.xxx就好了吗?为何要搞那么复杂呢?所以,先说一下场景,为什么要通过TurboFilter去动态的修改日志级别.我们在使用Java开发 ...

  6. 【转载】C#使用正则表达式校验邮箱

    在C#中,可以使用Regex正则表达式类来校验前台提交过来的邮箱字段信息是否符合要求,Regex类是C#中有关正则表达式处理的相关类,功能强大,我们只需要在实例化Regex类的时候指定相应的规则为邮箱 ...

  7. This relative module was not found (转载)

    vue踩坑-This relative module was not found 在使用vue.js的日期选择插件 的时候,报错如下   This relative module was not fo ...

  8. [android] 分析setting源代码获取SD卡大小

    保存文件到sd卡需要判断sd卡的大小,通过查看android系统的自带应用的源代码,得到方法,sdk下面的source是sdk的源代码,包含的是android.Jar下面的所有class的源代码.在a ...

  9. Netty实战十之编解码器框架

    编码和解码,或者数据从一种特定协议的格式到另一种格式的转换.这些任务将由通常称为编解码器的组件来处理.Netty提供了多种组件,简化了为了支持广泛的协议而创建自定义的编解码器的过程.例如,如果你正在构 ...

  10. Java基础篇——JVM之GC原理(干货满满)

    原创不易,如需转载,请注明出处https://www.cnblogs.com/baixianlong/p/10697554.html ,多多支持哈! 一.什么是GC? GC是垃圾收集的意思,内存处理是 ...