centos性能监控系列一：常用监控命令

Linux系统出现问题时，我们不仅需要查看系统日志信息，而且还要使用大量的性能监测工具来判断究竟是哪一部分（内存、CPU、硬盘……）出了问题

下面就让我们了解一下这些常用的性能监控工具。

1、uptime

uptime命令用于查看服务器运行了多长时间以及有多少个用户登录，快速获知服务器的负荷情况。

uptime的输出包含一项内容是load average，显示了最近1，5，15分钟的负荷情况。它的值代表等待CPU处理的进程数，如果CPU没有时间处理这些进程，load average值会升高；反之则会降低。

load average的最佳值是1，说明每个进程都可以马上处理并且没有CPU cycles被丢失。对于单CPU的机器，1或者2是可以接受的值；对于多路CPU的机器，load average值可能在8到10之间。

也可以使用uptime命令来判断网络性能。例如，某个网络应用性能很低，通过运行uptime查看服务器的负荷是否很高，如果不是，那么问题应该是网络方面造成的。

以下是uptime的运行实例：

9:24am up 19:06, 1 user, load average: 0.00, 0.00, 0.00

也可以查看/proc/loadavg和/proc/uptime两个文件，注意不能编辑/proc中的文件，要用cat等命令来查看，如：

liyawei:~ # cat /proc/loadavg

0.00 0.00 0.00 1/55 5505

2、dmesg

dmesg命令主要用来显示内核信息。使用dmesg可以有效诊断机器硬件故障或者添加硬件出现的问题。

另外，使用dmesg可以确定您的服务器安装了那些硬件。每次系统重启，系统都会检查所有硬件并将信息记录下来。执行/bin/dmesg命令可以查看该记录。

dmesg输入实例：

ReiserFS: hda6: checking transaction log (hda6)

ReiserFS: hda6: Using r5 hash to sort names

Adding 1044184k swap on /dev/hda5. Priority:-1 extents:1 across:1044184k

parport_pc: VIA 686A/8231 detected

parport_pc: probing current configuration

parport_pc: Current parallel port base: 0x378

parport0: PC-style at 0x378 (0x778), irq 7, using FIFO [PCSPP,TRISTATE,COMPAT,ECP]

parport_pc: VIA parallel port: io=0x378, irq=7

lp0: using parport0 (interrupt-driven).

e100: Intel(R) PRO/100 Network Driver, 3.5.10-k2-NAPI

e100: Copyright(c) 1999-2005 Intel Corporation

ACPI: PCI Interrupt 0000:00:0d.0[A] -> GSI 17 (level, low) -> IRQ 169

e100: eth0: e100_probe: addr 0xd8042000, irq 169, MAC addr 00:02:55:1E:35:91

usbcore: registered new driver usbfs

usbcore: registered new driver hub

hdc: ATAPI 48X CD-ROM drive, 128kB Cache, UDMA(33)

Uniform CD-ROM driver Revision: 3.20

USB Universal Host Controller Interface driver v2.3

3、top

top命令显示处理器的活动状况。缺省情况下，显示占用CPU最多的任务，并且每隔5秒钟做一次刷新。

Process priority的数值决定了CPU处理进程的顺序。LIUNX内核会根据需要调整该数值的大小。nice value局限于priority。priority的值不能低于nice value（nice value值越低，优先级越高）。您不可以直接修改Process priority的值，但是可以通过调整nice level值来间接地改变Process priority值，然而这一方法并不是所有时候都可用。如果某个进程运行异常的慢，可以通过降低nice
level为该进程分配更多的CPU。

Linux 支持的 nice levels 由19 (优先级低)到-20 (优先级高)，缺省值为0。

执行/bin/ps命令可以查看到当前进程的情况。

4、iostat

iostat由Red Hat Enterprise Linux AS发布。同时iostat也是Sysstat的一部分，可以下载到，网址是http://perso.wanadoo.fr/sebastien.godard/

执行iostat命令可以从系统启动之后的CPU平均时间，类似于uptime。除此之外，iostat还对创建一个服务器磁盘子系统的活动报告。该报告包含两部分：CPU使用情况和磁盘使用情况。

iostat显示实例：

avg-cpu: %user %nice %system %iowait %steal %idle

0.16 0.01 0.03 0.10 0.00 99.71

Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn

hda 0.31 4.65 4.12 327796 290832

avg-cpu: %user %nice %system %iowait %steal %idle

1.00 0.00 0.00 0.00 0.00 100.00

Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn

hda 0.00 0.00 0.00 0 0

avg-cpu: %user %nice %system %iowait %steal %idle

0.00 0.00 0.00 0.00 0.00 99.01

Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn

hda 0.00 0.00 0.00 0 0

CPU占用情况包括四块内容

%user：显示user level (applications)时，CPU的占用情况。

%nice：显示user level在nice priority时，CPU的占用情况。

%sys:显示system level (kernel)时，CPU的占用情况。

%idle: 显示CPU空闲时间所占比例。

磁盘使用报告分成以下几个部分：

Device: 块设备的名字

tps: 该设备每秒I/O传输的次数。多个I/O请求可以组合为一个，每个I/O请求传输的字节数不同，因此可以将多个I/O请求合并为一个。

Blk_read/s, Blk_wrtn/s: 表示从该设备每秒读写的数据块数量。块的大小可以不同，如1024, 2048 或 4048字节，这取决于partition的大小。

例如，执行下列命令获得设备/dev/sda1 的数据块大小：

dumpe2fs -h /dev/sda1 |grep -F "Block size"

输出结果如下

dumpe2fs 1.34 (25-Jul-2003)

Block size: 1024

Blk_read, Blk_wrtn: 指示自从系统启动之后数据块读/写的合计数。

也可以查看这几个文件/proc/stat，/proc/partitions，/proc/diskstats的内容。

5、vmstat

vmstat提供了processes, memory, paging, block I/O, traps和CPU的活动状况

procs -----------memory---------- ---swap-- -----io---- -system-- -----cpu------

r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

1  0      0 513072  52324 162404    0    0     2     2  261   32  0  0 100  0  0

0  0      0 513072  52324 162404    0    0     0     0  271   43  0  0 100  0  0

0  0      0 513072  52324 162404    0    0     0     0  255   27  0  0 100  0  0

0  0      0 513072  52324 162404    0    0     0    28  275   51  0  0 97  3  0

0  0      0 513072  52324 162404    0    0     0     0  255   21  0  0 100  0  0

各输出列的含义：

Process

– r: The number of processes waiting for runtime.

– b: The number of processes in uninterruptable sleep.

Memory

– swpd: The amount of virtual memory used (KB).

– free: The amount of idle memory (KB).

– buff: The amount of memory used as buffers (KB).

Swap

– si: Amount of memory swapped from the disk (KBps).

– so: Amount of memory swapped to the disk (KBps).

IO

– bi: Blocks sent to a block device (blocks/s).

– bo: Blocks received from a block device (blocks/s).

System

– in: The number of interrupts per second, including the clock.

– cs: The number of context switches per second.

CPU (these are percentages of total CPU time)

- us: Time spent running non-kernel code (user time, including nice time).

– sy: Time spent running kernel code (system time).

– id: Time spent idle. Prior to Linux 2.5.41, this included IO-wait time.

– wa: Time spent waiting for IO. Prior to Linux 2.5.41, this appeared as zero.

6、sar

sar是Red Hat Enterprise Linux AS发行的一个工具，同时也是Sysstat工具集的命令之一，可以从以下网址下载：http://perso.wanadoo.fr/sebastien.godard/

sar用于收集、报告或者保存系统活动信息。sar由三个应用组成：sar显示数据、sar1和sar2用于收集和保存数据。

使用sar1和sar2，系统能够配置成自动抓取信息和日志，以备分析使用。配置举例：在/etc/crontab中添加如下几行内容

同样的，你也可以在命令行方式下使用sar运行实时报告。如图所示：

从收集的信息中，可以得到详细的CPU使用情况(%user, %nice, %system, %idle)、内存页面调度、网络I/O、进程活动、块设备活动、以及interrupts/second

liyawei:~ # sar -u 3 10

Linux 2.6.16.21-0.8-default (liyawei) 05/31/07

10:17:16          CPU     %user     %nice   %system   %iowait     %idle

10:17:19          all      0.00      0.00      0.00      0.00    100.00

10:17:22          all      0.00      0.00      0.00      0.33     99.67

10:17:25          all      0.00      0.00      0.00      0.00    100.00

10:17:28          all      0.00      0.00      0.00      0.00    100.00

10:17:31          all      0.00      0.00      0.00      0.00    100.00

10:17:34          all      0.00      0.00      0.00      0.00    100.00

7、

8、free

/bin/free命令显示所有空闲的和使用的内存数量，包括swap。同时也包含内核使用的缓存。

total       used       free     shared    buffers     cached

Mem:        776492     263480     513012          0      52332     162504

-/+ buffers/cache:      48644     727848

Swap:      1044184          0    1044184

9、

10、pmap

pmap可以报告某个或多个进程的内存使用情况。使用pmap判断主机中哪个进程因占用过多内存导致内存瓶颈。

pmap <pid>

liyawei:~ # pmap  1

1: init

START       SIZE     RSS   DIRTY PERM MAPPING

08048000    484K    244K      0K r-xp /sbin/init

080c1000      4K      4K      4K rw-p /sbin/init

080c2000    144K     24K     24K rw-p [heap]

bfb5b000     84K     12K     12K rw-p [stack]

ffffe000      4K      0K      0K ---p [vdso]

Total:      720K    284K     40K

232K writable-private, 488K readonly-private, and 0K shared

11、strace

strace截取和记录系统进程调用，以及进程收到的信号。是一个非常有效的检测、指导和调试工具。系统管理员可以通过该命令容易地解决程序问题。

使用该命令需要指明进程的ID(PID)，例如：

strace -p <pid>

# strace –p 2582

rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0

read(7, "\"\\\"\\\\\\\"\\\\\\\\\\\\\\\"\\\\\\\\\\\\\\\\\\\\\\\\"..., 16384) = 321

write(3, "}H\331q\37\275$\271\t\311M\304$\317~)R9\330Oj\304\257\327"..., 360) = 360

select(8, [3 4 7], [3], NULL, NULL)     = 2 (in [7], out [3])

rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0

rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0

read(7, "\"\\\"\\\\\\\"\\\\\\\\\\\\\\\"\\\\\\\\\\\\\\\\\\\\\\\\"..., 16384) = 323

write(3, "\204\303\27$\35\206\\\306VL\370\5R\200\226\2\320^\253\253"..., 360) = 360

select(8, [3 4 7], [3], NULL, NULL)     = 2 (in [7], out [3])

rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0

rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0

read(7, "\"\\\"\\\\\\\"\\\\\\\\\\\\\\\"\\\\\\\\\\\\\\\\\\\\\\\\"..., 16384) = 323

write(3, "\243\207\204\277Cw\0162\2ju=\205\'L\352?0J\256I\376\32"..., 360) = 360

select(8, [3 4 7], [3], NULL, NULL)     = 2 (in [7], out [3])

rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0

rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0

read(7, "\"\\\"\\\\\\\"\\\\\\\\\\\\\\\"\\\\\\\\\\\\\\\\\\\\\\\\"..., 16384) = 320

write(3, "6\270S\3i\310\334\301\253!ys\324\'\234%\356\305\26\233"..., 360) = 360

select(8, [3 4 7], [3], NULL, NULL)     = 2 (in [7], out [3])

rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0

rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0

12、ulimit

ulimit内置在bash shell中，用来提供对shell和进程可用资源的控制

liyawei:~ # ulimit -a

core file size          (blocks, -c) 0

data seg size           (kbytes, -d) unlimited

file size               (blocks, -f) unlimited

pending signals                 (-i) 6143

max locked memory       (kbytes, -l) 32

max memory size         (kbytes, -m) unlimited

open files                      (-n) 1024

pipe size            (512 bytes, -p) 8

POSIX message queues     (bytes, -q) 819200

stack size              (kbytes, -s) 8192

cpu time               (seconds, -t) unlimited

max user processes              (-u) 6143

virtual memory          (kbytes, -v) unlimited

file locks                      (-x) unlimited

-H和-S选项指明所给资源的软硬限制。如果超过了软限制，系统管理员会收到警告信息。硬限制指在用户收到超过文件句炳限制的错误信息之前，可以达到的最大值。

例如可以设置对文件句炳的硬限制：ulimit -Hn 4096

例如可以设置对文件句炳的软限制：ulimit -Sn 1024

查看软硬值，执行如下命令：

ulimit -Hn

ulimit -Sn

例如限制Oracle用户. 在/etc/security/limits.conf输入以下行:

soft nofile 4096

hard nofile 10240

对于Red Hat Enterprise Linux AS，确定文件/etc/pam.d/system-auth包含如下行

session required /lib/security/$ISA/pam_limits.so

对于SUSE LINUX Enterprise Server，确定文件/etc/pam.d/login 和/etc/pam.d/sshd包含如下行：

session required pam_limits.so

这一行使这些限制生效。

13、mpstat

mpstat是Sysstat工具集的一部分，下载地址是http://perso.wanadoo.fr/sebastien.godard/

mpstat用于报告多路CPU主机的每颗CPU活动情况，以及整个主机的CPU情况。

例如，下边的命令可以隔2秒报告一次处理器的活动情况，执行3次

mpstat 2 3

liyawei:~ # mpstat 2 3

Linux 2.6.16.21-0.8-default (liyawei) 05/31/07

10:23:03     CPU   %user   %nice    %sys %iowait    %irq   %soft  %steal   %idle    intr/s

10:23:05     all    0.50    0.00    0.00    1.99    0.00    0.00    0.00   97.51    271.64

10:23:07     all    0.00    0.00    0.00    0.00    0.00    0.00    0.00  100.00    261.00

10:23:09     all    0.00    0.00    0.00    0.00    0.00    0.00    0.00  100.00    261.50

Average:     all    0.17    0.00    0.00    0.67    0.00    0.00    0.00   99.17    264.73

如下命令每隔1秒显示一次多路CPU主机的处理器活动情况，执行3次

mpstat -P ALL 1 3

liyawei:~ # mpstat -P ALL 1 10

Linux 2.6.16.21-0.8-default (liyawei)   05/31/07

10:23:31     CPU   %user   %nice    %sys %iowait    %irq   %soft  %steal   %idle    intr/s

10:23:32     all    0.00    0.00    0.00    0.00    0.00    0.00    0.00  100.00    273.00

10:23:32       0    0.00    0.00    0.00    0.00    0.00    0.00    0.00  100.00    272.00

10:23:33     all    0.00    0.00    0.00    0.00    0.00    0.00    0.00  100.00    254.00

10:23:33       0    0.00    0.00    0.00    0.00    0.00    0.00    0.00  100.00    254.00

10:23:34     all    0.00    0.00    0.00    0.00    0.00    0.00    0.00 100.00    271.00

10:23:34       0    0.00    0.00    0.00    0.00    0.00    0.00    0.00  100.00    271.00

10:23:35     all    0.00    0.00    0.00    1.98    0.00    0.00    0.00   98.02    254.46

10:23:35       0    0.00    0.00    0.00    1.98    0.00    0.00    0.00

98.02 254.46

centos性能监控系列一：常用监控命令的更多相关文章

MySQL系列--2.常用的命令
1 .创建数据库 #语法: CREATE DATABASE dbName; #创建数据库rms create database rms; 2.切换数据库 #选择数据库 USE dbName; #选择数 ...
CentOS 7 下Ansiable搭建命令列表及常用监控指令
根据文章 [ 自动化运维工具Ansible详细部署 ] 搭建 ============================================================== 1.Ans ...
前端监控系列4 ｜ SDK 体积与性能优化实践
背景字节各类业务拥有众多用户群,作为字节前端性能监控 SDK,自身若存在性能问题,则会影响到数以亿计的真实用户的体验.所以此类 SDK 自身的性能在设计之初,就必须达到一个非常极致的水准. 与此同时 ...
9个Linux系统常用监控命令
我们的系统一旦上线跑起来我们自然希望它一直相安无事,不要宕机,不要无响应,不要慢腾腾的.但是这不是打开机器电源然后放任不管就可以得到的.所以我们要监视系统的运行状况,发现问题及时处理. 对于系统和网络 ...
Linux常用监控命令
A goal is a dream with a deadline. Much effort, much prosperity. 1.IOSTAT命令此命令安装包为sysstat 可用yu ...
redis常用监控命令
redis常用监控命令 1.实时监控redis服务收到来自应用的所有命令 1 2 3 4 5 6 7 redis-cli 127.0.0.1:6379>monitor 150996415 ...
抛砖系列之redis监控命令
前言 redis是一款非常流行的kv数据库,以高性能著称,其高吞吐.低延迟等特性让广大开发者趋之若鹜,每每看到别人发出的redis故障报告都让我产生一种居安思危,以史为鉴的危机感,恰逢今年十一西安烟雨 ...
你必须知道的容器监控 (1) Docker自带子命令与Weave Scope
本篇已加入<.NET Core on K8S学习实践系列文章索引>,可以点击查看更多容器化技术相关系列文章.本篇会介绍几个目前比较常用且流行的容器监控工具,首先我们来看看Docker自带的 ...
性能测试三十三：监控之Linux系统监控命令大全
1.top命令top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器.下面详细介绍它的使用方法.top - 01:06:48 up 1: ...
【0.2】【MySQL】常用监控指标及监控方法（转）
[MySQL]常用监控指标及监控方法转自:https://www.cnblogs.com/wwcom123/p/10759494.html 对之前生产中使用过的MySQL数据库监控指标做个小结. ...

随机推荐

15个带给您优秀用户体验的移动应用 UI 设计
在今天在移动 App 界面设计中,你可以看到不同创意类型的视觉效果.特别是在 Dribbble 上面,有有很多移动应用程序的 UI 概念设计,让你惊叹.如果你想获得灵感,那很有必要看看下面15个优秀用 ...
spring事务与消息队列
在开发过程中,遇到一个bug,产生bug的原因是spring事务提交晚于消息队列的生产消息,导致消息队列消费消息时获取到的数据不正确.这篇文章介绍问题的产生和一步步的解决过程. 一.问题的产生: 场景 ...
Java中接口式的匿名内部类的构造方法
在使用多线程的时候,时常会使用两种方式实现,一种是直接继承Thread类来实现多线程,另外一种就是实现Runnable接口. 我们都知道,接口是没有构造方法的,同时匿名内部类也是没有构造方法的.原因有 ...
HTTP Cookie/Session
一.HTTP协议 HTTP协议是一个无状态协议,服务器无法判断若干个请求是否来自同一个浏览器,无法与浏览器进行会话. 二.HTTP会话控制:Cookie Cookie技术是使用在浏览器端的一种缓存技术 ...
构建之法第6~7章读后感和对Scrum的理解
第六章-敏捷流程第六章主要详细介绍了敏捷流程,在软件工程范畴里,“敏捷流程”是一系列价值观和方法论的集合.这一章以敏捷流程的Scrum方法论而展开,而敏捷流程的精髓就是在于快速的交付. 敏捷开发的流 ...
XSS 和 CSRF 攻击
web安全中有很多种攻击手段,除了SQL注入外,比较常见的还有 XSS 和 CSRF等一.XSS(Cross Site Scripting)跨站脚本 XSS其实就是Html的注入问题,攻击者的输入没 ...
HDFS Append时packet的格式以及DataNode对block/checksum文件的处理
HDFS Append时packet的格式以及DataNode对block/checksum文件的处理 HDFS的Block一般比较大,默认64MB/128MB,客户端给DataNode发数据实际上是 ...
C#一个方法返回多个值
示例代码: static void Main(string[] args) { //声明 int value; string strOutValue; //调用函数 //函数的参数有两个返回的值 Re ...
【循序渐进学Python】10.模块和包
1.导入模块任何Python程序都可以作为模块导入,只要Python解释器能找到我们定义的模块所在位置即可,一般来讲,在一个模块被导入时,Python解释器会按照下面的步骤进行搜索: 在当前所在目录 ...
sql where 1=1和 0=1 的作用
sql where 1=1和 0=1 的作用摘自: http://www.cnblogs.com/junyuz/archive/2011/03/10/1979646.html where 1=1; ...

centos性能监控系列一：常用监控命令

centos性能监控系列一：常用监控命令的更多相关文章

随机推荐

热门专题