监控的工具---top

第一行:

  1. 03:07:27 当前系统时间
  2. 3 days, 18:58 系统已经运行了3天18小时58分钟(在这期间没有重启过)
  3. 4 users
  4. load average: 0.00, 0.00, 0.00

  Load这个东西怎么理解呢,就像一条马路,有N个车道,如果N个进程进入车道,那么正好一人一个,再多一辆车就占不到车道,要等有一个车空出车道。 在CPU中可以理解为CPU可以并行处理的任务数,那么就是“CPU个数 * 核数”,如果CPU Load = CPU个数 * 核数 那么就是说CPU正好满负载,再多一点,可能就要出问题了,有任务不能被及时分配处理器,那么保证性能的话,最好是小于CPU个数 * 核数 *0.7。

  Load Average是 CPU的 Load,它所包含的信息不是 CPU的使用率状况,而是在一段时间内 CPU正在处理以及等待 CPU处理的进程数之和的统计信息,也就是 CPU使用队列的长度的统计信息

Load Average < CPU个数 * 核数 *0.7

  使用 vmstat 看到的数据中也有这个数据,vmstat 查看r(Load Average)

第二行:

Tasks 任务(进程),系统现在共有108个进程,其中处于运行中的有2个,105个在休眠(sleep),stoped状态的有1个,zombie状态(僵尸)的有0个。

第三行:CPU状态

  1. 0.0% us 用户空间占用CPU的百分比。
  2. 0.0% sy 内核空间占用CPU的百分比。
  3. 0.0% ni 改变过优先级的进程占用CPU的百分比
  4. 99.7% id 空闲CPU百分比
  5. 0.3% wa IO等待占用CPU的百分比
  6. 0.0% hi 硬中断(Hardware IRQ)占用CPU的百分比
  7. 0.0% si 软中断(Software Interrupts)占用CPU的百分比

第四行:内存状态

  1. 1035660k total 物理内存总量(1GB)
  2. 1025928k used 使用中的内存总量(0.9GB)
  3. 9732k free 空闲内存总量(9M)
  4. 37784k buffers 缓存的内存量 (3.5M)

第五行:swap交换分区

  1. 2048276k total 交换区总量(2GB)
  2. 52576k used 使用的交换区总量(50M)
  3. 1995700k free 空闲交换区总量(1.9GB)
  4. 756448k cached 缓冲的交换区总量(750M)

  第四行中使用中的内存总量(used)指的是现在系统内核控制的内存数,空闲内存总量(free)是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中,还包括过去使用过的现在可以被重复利用的内存,内核并不把这些可被重新使用的内存交还到free中去,因此在linux上free内存会越来越少。

  可用内存的近似计算公式=第四行的free + 第四行的buffers + 第五行的cached

  第五行swap交换分区的used,如果这个数值在不断的变化,说明内核在不断进行内存和swap的数据交换,这是真正的内存不够用了。

第七行以下:各进程(任务)的状态监控

  1. PID 进程id
  2. USER 进程所有者
  3. PR 进程优先级
  4. NI nice值。负值表示高优先级,正值表示低优先级
  5. VIRT 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
  6. RES 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
  7. SHR 共享内存大小,单位kb
  8. S 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
  9. %CPU 上次更新到现在的CPU时间占用百分比
  10. %MEM 进程使用的物理内存百分比
  11. TIME+ 进程使用的CPU时间总计,单位1/100秒
  12. COMMAND 进程名称(命令名/命令行)

  按键盘数字1,可监控每个逻辑CPU的状况

监控的工具---vmstat

vmstat--CPU相关参数介绍:

  1. r,可运行队列的线程数,这些线程都是可运行状态,有多数的进程等待CPU;
  2. b,被 blocked 的进程数,正在等待 IO 请求;
  3. in,被处理过的中断数
  4. cs,系统上正在做上下文切换的数目
  5. us,用户占用 CPU 的百分比
  6. sys,内核和中断占用 CPU 的百分比
  7. wa,所有可运行的线程被 blocked 以后都在等待 IO,这时候 CPU 空闲的百分比
  8. id,CPU 完全空闲的百分比

vmstat--内存参数说明:

  1. swpd,已使用的 SWAP 空间大小,KB 为单位;
  2. free,可用的物理内存大小,KB 为单位;
  3. buff,物理内存用来缓存读写操作的 buffer 大小,KB 为单位;
  4. cache,物理内存用来缓存进程地址空间的 cache 大小,KB 为单位;
  5. si,数据从 SWAP 读取到 RAM(swap in)的大小,KB 为单位;
  6. so,数据从 RAM 写到 SWAP(swap out)的大小,KB 为单位;
  7. bi,磁盘块从文件系统或 SWAP 读取到 RAM(blocks in)的大小,block 为单位;
  8. bo,磁盘块从 RAM 写到文件系统或 SWAP(blocks out)的大小,block 为单位;

  不同的系统用途也不同,要找到性能瓶颈需要知道系统跑的是什么应用、有些什么特点,比如 webserver 对系统的要求肯定和 file server 不一样,所以分清不同系统的应用类型很重要,通常应用可以分为两种类型:

①IO 相关,IO 相关的应用通常用来处理大量数据,需要大量内存和存储,频繁 IO 操作读写数据,而对CPU 的要求则较少,大部分时候 CPU 都在等待硬盘,比如,数据库服务器、文件服务器等。
②CPU 相关,CPU 相关的应用需要使用大量 CPU,比如高并发的 web/mail 服务器、图像/视频处理、科学计算等都可被视作 CPU 相关的应用。

看看实际中的例子,第1个是文件服务器拷贝一个大文件时表现出来的特征:

第2个是 CPU 做大量计算时表现出来的特征:

第一个示例:id 在50%左右,说明cpu比较空闲;bi,bo的值较大说明瓶颈在IO上

第二个示例:r为4(= CPU个数 * 核数),id 为0,说明cpu处于繁忙状态;bi,bo的值较小

Linux性能监控top及vmstat命令的更多相关文章

  1. Linux 性能监控的18个命令行工具

    对于系统和网络管理员来说每天监控和调试Linux系统的性能问题是一项繁重的工作.在IT领域作为一名Linux系统的管理员工作5年后,我逐渐 认识到监控和保持系统启动并运行是多么的不容易.基于此原因,我 ...

  2. Linux性能分析top iostat vmstat free

    最近看到一大牛的分析报告,才知道笔者认识这4个命令是多么肤浅,其实要读懂内存的信息,是要一些功力的.1.top   VIRT           虚拟内存总量,VIRT=SWAP+RESSWAP    ...

  3. Linux性能监控

    转自:http://blog.csdn.net/chosen0ne/article/details/8200737 linux性能监控,就是要监控系统的各个子系统是否正常.linux主要的子系统包括: ...

  4. 性能测试培训:帮你定位 Linux 性能问题的 18 个命令以及工具

    性能测试培训:帮你定位 Linux 性能问题的 18 个命令以及工具 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.在popte ...

  5. Linux 性能监控之CPU&内存&I/O监控Shell脚本2

    Linux 性能监控之CPU&内存&I/O监控Shell脚本2   by:授客 QQ:1033553122 思路: 捕获数据->停止捕获数据->提取数据 备注:一些命令的输 ...

  6. Linux性能监控与分析之--- CPU

    Linux性能监控与分析之--- CPU 望月成三人关注 2016.07.25 18:16:12字数 1,576阅读 2,837 CPU性能指标 用户进程使用CPU的比率 系统进程使用CPU的比率 W ...

  7. Linux 性能监控之CPU&内存&I/O监控Shell脚本1

    Linux 性能监控之CPU&内存&I/O监控Shell脚本1   by:授客 QQ:1033553122   #!/bin/bash # 获取要监控的本地服务器IP地址 IP=`if ...

  8. linux性能监控 -CPU、Memory、IO、Network等指标的讲解

    [操作系统-linux]linux性能监控 -CPU.Memory.IO.Network等指标的讲解(转) 一.CPU 1.良好状态指标 CPU利用率:User Time <= 70%,Syst ...

  9. Linux性能监控分析命令(四)—top命令介绍

    性能监控分析的命令包括如下: 1.vmstat 2.sar 3.iostat 4.top 5.free 6.uptime 7.netstat 8.ps 9.strace 10.lsof ======= ...

随机推荐

  1. Windows配置端口转发

    windows命令行下用netsh实现端口转发 微软Windows的netsh是一个命令行脚本实用工具.使用netsh工具 ,可以查看或更改本地计算机或远程计算机的网络配置.不仅可以在本地计算机上运行 ...

  2. 【Android车载系统 News | Tech 2】News 谷歌开发新车载系统!安卓Auto不是终点 2014-12-20

    Google在今年推出了车载安卓系统Android Auto,旨在为汽车提供娱乐.导航等功能.不过,Android Auto并不是终点,现在有消息报道,Google正在开发一个能够彻底取代汽车底层控制 ...

  3. 在ios开发中nil和NUll和Nilde区别————和如何判断连个对象的关系和UISlider不能拖动的问题

    nil表示一个对象指针为空,针对对象 >示例代码: NSString *someString = nil; NSURL *someURL = nil; id someObject = nil; ...

  4. 流操作text文件------读取、保存文档

    ************************************一.读取指定text文档中的内容:**************************************** 方法一. t ...

  5. Linux 字符设备驱动模型

    一.使用字符设备驱动程序 1. 编译/安装驱动 在Linux系统中,驱动程序通常采用内核模块的程序结构来进行编码.因此,编译/安装一个驱动程序,其实质就是编译/安装一个内核模块 2. 创建设备文件 通 ...

  6. How to Use Rsync to Sync New or Changed/Modified Files in Linux

    As a system administrator or Linux power user, you may have probably come across or even on several ...

  7. Sharepoint 高级筛选

    先看看效果吧.............. 默认情况下:不做任何筛选. 添加一个筛选条件: 条件:如果是int类型那么可以有> < = 等 如果是string的话那么就没有这么多条件,当然这 ...

  8. django 学习-18 用户管理Auth系统使用

    1.首先跟之前说的admin的要求有点像, vim urls.py from django.contrib import adminadmin.autodiscover()               ...

  9. 【网络收集】order by 自定义排序

    使用order by排序,有时候不是根据字符或数字顺序,而是根据实际要求排序. 例如有客户A,B,C,我希望排序结果是B,C,A,那么就要通过自定义的规则排序. 第一种方法,可以构造一张映射表,将客户 ...

  10. hexo资源--theme等

    Hexo (https://github.com/hexojs/hexo) [3]hexo你的博客(http://ibruce.info/2013/11/22/hexo-your-blog/) [4] ...