linux 系统性能指标

一、查看CPU使用情况

cpu使用率反映的是当前cpu的繁忙程度，忽高忽低的原因在于占用cpu处理时间的进程可能处于io等待状态但却还未释放进入wait。

平均负载（loadaverage）是指某段时间内占用cpu时间的进程和等待cpu时间的进程数，这里等待cpu时间的进程是指等待被唤醒的进程，不包括处于wait状态进程。

1、良好状态指标

CPU利用率：

User Time <=70%，System Time <= 35%，User Time + System Time <= 70%。

上下文切换：与CPU利用率相关联，如果CPU利用率状态良好，大量的上下文切换也是可以接受的。

可运行队列：每个处理器的可运行队列<=3个线程。

2、工具

（1）vmstat

字段说明：

r (run queue)可运行队列的线程数，这些线程都是可运行状态，只不过CPU暂时不可用；

b，被blocked的进程数，正在等待IO请求;

in，interrupts，被处理过的中断数;

cs，context switch，系统上正在做上下文切换的数目;

us，用户占用CPU的百分比

sys，内核和中断占用CPU的百分比

id，CPU完全空闲的百分比

(2)uptime

[root@node1 ~]#uptime

:: up :, users, load average: 8.13, 5.90, ,

显示的是过去的1,,15分钟内进程队列中的平均进程数量

如何衡量当前系统是否负载过高?

如果每个cpu(可以按CPU核心的数量计算)上当前活动进程数

<=3，则系统性能良好，

=4，表示可以接受

>=5，则系统性能问题严重

上面例中的8.13,如果有2个cpu核心,则8.13/2=4.065, 此系统性能可以接受

建议设置严格的报警值为: CPU核心的数量

比如：CPU核心数量为2，则设置报警值为2

(3)top

[root@node1 ~]#top

top - :: up14:,  users, load average: 0.07, 0.33, 0.33

Tasks:  total, 1running,  sleeping,  stopped,  zombie

Cpu(s): 0.0%us,0.2%sy, 0.0%ni, 99.8%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

Mem: 502288ktotal, 494648k used, 7640k free, 220k buffers

Swap: 1015800ktotal, 21792k used, 994008k free, 238468k cached

从top 要看CPU负载情况，可以看%us和%sy，其中%us<=70%, %sy<=35%,

%us+%sy<=70%说明状态良好，同时可以结合idle值来看，也就是%id，如果%id<=70% 则表示IO的压力较大

查看某个进程占用的CPU资源

二、Memory

1、良好状态指标

swap in （si） == 0，swap out （so） == 0

应用程序可用内存/系统物理内存 <= 70%

2、监控工具

（1）vmstat

三、磁盘IO

1、良好状态指标

iowait % < 20%

提高命中率的一个简单方式就是增大文件缓存区面积，缓存区越大预存的页面就越多，命中率也越高。

Linux 内核希望能尽可能产生次缺页中断（从文件缓存区读），并且能尽可能避免主缺页中断（从硬盘读），这样随着次缺页中断的增多，文件缓存区也逐步增大，直到系统只有少量可用物理内存的时候 Linux 才开始释放一些不用的页。

2、监控工具

(1)cat/proc/meminfo

这台机器总共有 256MB 物理内存（MemTotal），90MB 左右可用内存（MemFree），8MB左右用来做磁盘缓存（Buffers），40MB左右用来做文件缓存区（Cached）。

(2)sar

await表示平均每次设备I/O操作的等待时间（以毫秒为单位）。

svctm表示平均每次设备I/O操作的服务时间（以毫秒为单位）。

%util表示一秒中有百分之几的时间用于I/O操作。

如果svctm的值与await很接近，表示几乎没有I/O等待，磁盘性能很好，如果await的值远高于svctm的值，则表示I/O队列等待太长，系统上运行的应用程序将变慢。

如果%util接近100%，表示磁盘产生的I/O请求太多，I/O系统已经满负荷的在工作，该磁盘可能存在瓶颈。

(3)iostat

rrqm/s: 每秒进行 merge 的读操作数目。即 delta(rmerge)/s

wrqm/s: 每秒进行 merge 的写操作数目。即 delta(wmerge)/s

r/s: 每秒完成的读 I/O 设备次数。即 delta(rio)/s

w/s: 每秒完成的写 I/O 设备次数。即 delta(wio)/s

rsec/s: 每秒读扇区数。即 delta(rsect)/s

wsec/s: 每秒写扇区数。即 delta(wsect)/s

rkB/s: 每秒读K字节数。是 rsect/s 的一半，因为每扇区大小为512字节。(需要计算)

wkB/s: 每秒写K字节数。是 wsect/s 的一半。(需要计算)

avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)。delta(rsect+wsect)/delta(rio+wio)

avgqu-sz: 平均I/O队列长度。即 delta(aveq)/s/ (因为aveq的单位为毫秒)。

await: 平均每次设备I/O操作的等待时间 (毫秒)。即 delta(ruse+wuse)/delta(rio+wio)

svctm: 平均每次设备I/O操作的服务时间 (毫秒)。即 delta(use)/delta(rio+wio)

%util: 一秒中有百分之多少的时间用于 I/O 操作，或者说一秒中有多少时间 I/O 队列是非空的。即 delta(use)/s/ (因为use的单位为毫秒)

如果 %util 接近 %，说明产生的I/O请求太多，I/O系统已经满负荷，该磁盘可能存在瓶颈。

idle小于70% IO压力就较大了,一般读取速度有较多的wait.

同时可以结合vmstat 查看查看b参数(等待资源的进程数)和wa参数(IO等待所占用的CPU时间的百分比,高过30%时IO压力高)

四、Network IO

对于UDP

1、良好状态指标

接收、发送缓冲区不长时间有等待处理的网络包

2、监控工具

netstat

对于UDP服务，查看所有监听的UDP端口的网络情况

RecvQ、SendQ为0，或者不长时间有数值是比较正常的。

对于UDP服务，查看丢包情况（网卡收到了，但是应用层没有处理过来造成的丢包）

packet receiveerrors 这一项数值增长了，则表明在丢包

对于TCP

1、良好状态指标

对于TCP而言，不会出现因为缓存不足而存在丢包的事，因为网络等其他原因，导致丢了包，协议层也会通过重传机制来保证丢的包到达对方。

所以，tcp而言更多的专注重传率。

2、监控工具

重传率 = RetransSegs / OutSegs

至于这个值在多少范围内，算ok的，得看具体的业务了。

业务则更关注的是响应时间。

五、查看文件句柄数（文件描述符）

查看系统默认的最大文件句柄数，系统默认是1024

# ulimit -n

1024

查看当前进程打开了多少句柄数

# lsof -n|awk '{print $1,$2}'|sort|uniq-c|sort -nr|more

[root@node1 ~]#lsof -n|awk '{print $1,$2}'|sort|uniq -c|sort -nr

 master 

 sshd 

 mysqld 

 qmgr 

 pickup 

 sshd 

 rsyslogd 

 init 

 crond 

 udevd

　　........

其中第一列是打开的句柄数，第二列是进程ID。

本文转载自：http://lib.csdn.net/article/linux/33040

linux 系统性能指标的更多相关文章

shell脚本监控Linux系统性能指标
2016-11-04 22:41 原作者不详分类: Linux(7) 在服务器运维过程中,经常需要对服务器的各种资源进行监控, 例如:CPU的负载监控,磁盘的使用率监控,进程数目监控等等,以在系统出 ...
linux 系统性能指标采样脚本
以下脚本写于redmine性能排查时,用于定位系统性能瓶颈的采样,源地址为~/performanceLog/collectLog.sh中,计划放入github的代码片段库中. 注: 如果mysql的地 ...
[转]linux 系统监控、诊断工具之 IO wait
1.问题: 最近在做日志的实时同步,上线之前是做过单份线上日志压力测试的,消息队列和客户端.本机都没问题,但是没想到上了第二份日志之后,问题来了: 集群中的某台机器 top 看到负载巨高,集群中的机器 ...
【转载】Linux系统与性能监控
原文地址:http://kerrigan.sinaapp.com/post-7.html Linux System and Performance Monitoring http://www.hous ...
Linux系统与性能监控
原文地址:http://kerrigan.sinaapp.com/post-7.html Linux System and Performance Monitoring http://www.hous ...
关于linux系统CPU篇--->CPU使用率升高
1.CPU使用率为单位时间内CPU使用情况的统计,以百分比的方式展示. LINUX作为一个多任务操作系统,将每个CPU的时间划分为很短的时间片,再通过调度器轮流分配给各个任务使用,因此造成多任务同时运 ...
监控 Linux 系统的 7 个命令行工具
监控 Linux 系统的 7 个命令行工具: " 深入关于Linux最棒的一件事之一是你能深入操作系统,来探索它是如何工作的,并寻找机会来微调性能或诊断问题.这里有一些基本的命令行工具,让 ...
系统性能指标之 vmstat
系统性能指标 top top - 19:59:04 up 219 days, 21:51, 2 users, load average: 0.06, 0.06, 0.05 Tasks: 84 tota ...
Linux系统文件属性知识
---------------------------------------------------------------------------------------------------- ...

随机推荐

zend stdio 快捷键
1.快速跳转到当前所指的函数.变量.方法.类的定义处 F3或者 ctrl+鼠标左键2.ctrl+m 编辑窗口最大化3.ctrl+d 删除当前行4.ctrl+q 定位到最后编辑的地方(全局的)5.ctr ...
140725暑期培训.txt
1.若须要使用64位int 定义 __64int 类型 %I64d 2.Fibbonacci 数列採用递归的方法 int F(int n) { if(n= ...
WCF服务三：svc文件详解
在前面的文章中讲述过WCF服务的宿主程序主要包括:三种,在那篇文章中,简单的描述了如何把一个WCF服务寄宿到IIS上面,这篇文章中将具体讲述如何把一个WCF服务寄宿到IIS上面. 一.新建一个WCF服 ...
Spring Boot 属性配置&自定义属性配置
在使用spring boot过程中,可以发现项目中只需要极少的配置就能完成相应的功能,这归功于spring boot中的模块化配置,在pom.xml中依赖的每个Starter都有默认配置,而这些默认配 ...
NodeJS与Javascript时代
如果你一直在关注互联网的相关技术,你应该会有这样一种感觉,web技术正在发生着变革,虽然我们不愿相信,但一个事实已经越来越清晰的摆在了眼前:LAMP组合的时代将要成为历史,在web诞生的二十年间,它影 ...
那么类 Man 可以从类 Human 派生，类 Boy 可以从类 Man 派生
若在逻辑上 B 是 A 的“一种”(a kind of ),则允许 B 继承 A 的功能和属性. 例如男人(Man)是人(Human)的一种,男孩(Boy)是男人的一种. 那么类 Man 可以从类 ...
IIS状态码大全【转】
对于站长来说,经常分析下网站的IIS日志是有好处的,这样可以随时了解SE蜘蛛是否经常光顾自己的网站,都抓取了哪些页面,被抓取的页面哪些是被正常的,哪些是不正常的.而IIS日志有专门的返回状态码,为了方 ...
remote指令添加远程数据库
git remote add <name> <url> git remote add origin https://[your_space_id].backlogtool.co ...
mysql_ado的demo
winform程序 http://pan.baidu.com/s/1nvxm5br
Android无线测试之—UiAutomator UiScrollable API介绍八
设置滚动方向一.设置滚动方向相关API 返回值 API 描述 UiScrollable setAsHorizontalList 设置滚动方向为水平滚动 UiScrollable setAsVerti ...

linux 系统性能指标

linux 系统性能指标的更多相关文章

随机推荐

热门专题