Linux-平均负载指数

系统平均负载
平均负载分析

系统平均负载

什么是平均负载

# 什么是平均负载

平均负载可以反映出，单位时间内，系统处于可运行状态和不可中断状态的进程数，也就是活跃进程数。

# 可运行状态的进程 STAT 对应 R

# 不可中断状态进程 STAT 对应 D

# 平均负载与CPU有关，但不止和CPU有关

平均负载多少合理

举个例子，当CPU核心数为 4 , 2 , 1 时，平均负载为 2 的意味着什么？

CPU核心数	平均负载	概念
4	2	50%的CPU已经被占用
2	2	100%的CPU已经被占用
1	2	只有50%的进程占用了CPU

如何观察平均负载

# load average: 0.00, 0.01, 0.05

0.00	 # 1 分钟的平均负载 占用 0% 的CPU以及其他资源

0.01	 # 5 分钟的平均负载 占用 1% 的CPU以及其他资源

0.05	 # 15 分钟的平均负载 占用 5% 的CPU以及其他资源

		 # 平均负载与CPU有关，但不止和CPU有关

# 例 1：

# 若系统平均负载为 load average: 5.00,2.00,1.00 ，那么最近 1 分钟的平均负载变大，说明系统的平均负载趋势为增高，需要检查系统进程运行情况

# 例 2：

# 若系统平均负载为 load average: 1.00,2.00,5.00 ，那么 15 分钟的平均负载较大，说明徐彤的平均负载趋势为减小，可以检查 15 分钟前的系统进程运行情况

# 例 3：

# 若系统平均负载为 load average: 2.00,2.00,2.00 ，那么平均负载很“稳定”（是否稳定观察CPU核心数而定）

# 一般情况下，平均负载高于 70% ，就需要调试（70%=平均负载/CPU总核心数）

平均负载和CPU的使用率的区别

平均负载：平均负载指的是每单位时间内，处于可运行状态和不可中断状态的进程数，所以，它不仅包括了正在使用CPU的进程数，还包括等待CPU和等待IO的进程数。

CPU的使用率：单位时间内，CPU繁忙情况的统计，跟平均负载在并不一定完全对应。

为了区分平均负载和CPU的使用率之间的区别，我们要引入CPU密集型任务和I/O密集型任务的概念。

## 1. 举例 CPU密集型进程 和 IO密集型进程

# CPU密集型进程（特点是要进行大量的计算，消耗CPU资源）

CPU密集型也叫计算密集型，CPU有很多运算和逻辑判断要处理，使用大量的CPU会导致平均负载升高。

# IO密集型进程（特点是99%的时间都花在I/O读写上，花在CPU上的时间很少）

IO密集型进程，等待IO也会导致平均负载升高，此时大部分时间的CPU状态是在等待I/O读写操作，CPU使用率不一定很高。

# 2. 举例 大量进程调度

大量等待CPU的进程调度也会导致平均负载升高，此时的CPU使用率也会比较高。

平均负载分析

stress是Linux系统压力测试工具，这里我们用作异常进程模拟平均负载升高的场景。

mpstat是多核CPU性能分析工具，用来实时检查每个CPU的性能指标，以及所有CPU的平均指标。

pidstat是一个常用的进程性能分析工具，用来实时查看进程的CPU，内存，IO，以及上下文切换等性能指标。

# 安装 stress 软件包 以及 sysstat 软件包

[root@wqh06 ~]# yum -y install stress sysstat

11.7.3版本的sysstat，pidstat命令结果中包含了wait占用的时间百分比，点击下载rpm包

执行CPU密集型任务

## 案例一 执行CPU密集型任务

# CPU密集型进程压力测试（使CPU满载利用）

[root@wqh06 ~]# stress --cpu 1 --timeout 500

stress: info: [7749] dispatching hogs: 1 cpu, 0 io, 0 vm, 0 hdd

# 查看平均负载指数

[root@wqh06 ~]# watch -d uptime

Every 2.0s: uptime

Wed Apr 22 19:11:27 2020

19:11:27 up  6:53,  3 users,  load average: 0.54, 0.17, 0.09

# 使用mpstat -u 5 1 所有CPUs的负载，使用 mpstat -P ALL 列出总体以及每个CPU的负载

[root@wqh06 ~]# mpstat -u 5 1

Linux 3.10.0-957.el7.x86_64 (wqh06) 	04/22/2020 	_x86_64_	(1 CPU)

07:24:25 PM  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle

07:24:30 PM  all   99.80    0.00    0.20    0.00    0.00    0.00    0.00    0.00    0.00    0.00

Average:     all   99.80    0.00    0.20    0.00    0.00    0.00    0.00    0.00    0.00    0.00

[root@wqh06 ~]# mpstat -P ALL 5 1

Linux 3.10.0-957.el7.x86_64 (wqh06) 	04/22/2020 	_x86_64_	(1 CPU)

07:27:37 PM  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle

07:27:42 PM  all   99.80    0.00    0.20    0.00    0.00    0.00    0.00    0.00    0.00    0.00

07:27:42 PM    0   99.80    0.00    0.20    0.00    0.00    0.00    0.00    0.00    0.00    0.00

Average:     CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle

Average:     all   99.80    0.00    0.20    0.00    0.00    0.00    0.00    0.00    0.00    0.00

Average:       0   99.80    0.00    0.20    0.00    0.00    0.00    0.00    0.00    0.00    0.00

# 使用pidstat -u 5 1 观察

[root@wqh06 ~]# pidstat -u 5 1

Linux 3.10.0-957.el7.x86_64 (wqh06) 	04/22/2020 	_x86_64_	(1 CPU)

07:24:32 PM   UID       PID    %usr %system  %guest   %wait    %CPU   CPU  Command

07:24:37 PM     0      8634   99.40    0.00    0.00    0.60   99.40     0  stress

07:24:37 PM     0      8652    0.00    0.20    0.00    0.00    0.20     0  pidstat

Average:      UID       PID    %usr %system  %guest   %wait    %CPU   CPU  Command

Average:        0      8634   99.40    0.00    0.00    0.60   99.40     -  stress

Average:        0      8652    0.00    0.20    0.00    0.00    0.20     -  pidstat

执行I/O密集型任务

## 案例二 执行I/O密集型任务

# I/O密集型进程压力测试

[root@wqh06 ~]# stress --io 5 --timeout 500

stress: info: [8018] dispatching hogs: 0 cpu, 100 io, 0 vm, 0 hdd

# 查看平均负载指数

[root@wqh06 ~]# watch -d uptime

Every 2.0s: uptime                                                                                 Wed Apr 22 19:15:30 2020

19:47:09 up 6 min,  4 users,  load average: 4.09, 1.45, 0.57

### 注意：当运行命令 `stress --io 1000 --timeout 500` 时，会有 1000 个stress进程，平均负载指数会飙升，但CPU并不繁忙，运行一些指令也不会卡，也就是说I/O密集型任务会影响平均负载，但CPU利用率并不高

大量进程调度

## 案例三 大量进程调度

# 当前只有一个CPU核心，测试四个CPU核心的进程调度（给予四倍的活跃进程数）

[root@wqh06 ~]# stress --cpu 4 --timeout 500

stress: info: [8263] dispatching hogs: 4 cpu, 0 io, 0 vm, 0 hdd

# 查看平均负载指数

[root@wqh06 ~]# watch -d uptime

Every 2.0s: uptime                                                                                 Wed Apr 22 19:15:30 2020

19:38:21 up  7:20,  3 users,  load average: 4.12, 3.09, 4.77

关于平均负载的总结

1.平均负载高有可能是CPU密集型进程导致的
2.平均负载高并不一定代表CPU的使用率就一定高，还有可能是I/O繁忙
3.当发现负载高时，可以使用mpstat、pidstat等工具，快速定位到，负载高的原因，从而做出处理

Linux-平均负载指数的更多相关文章

linux 平均负载 load average 的含义【转】
文章来源: linux 平均负载 load average 的含义 load average 的含义平均负载(load average)是指系统的运行队列的平均利用率,也可以认为是可运行进程的平均数 ...
linux 平均负载 load average 的含义
load average 的含义平均负载(load average)是指系统的运行队列的平均利用率,也可以认为是可运行进程的平均数. 以路况为例, 单核CPU.单车道情况如下: 0.00-1. ...
linux平均负载的理解及原因排查
当系统响应缓慢时,一般会用top或uptime命令查看系统负载是否过高. 例如输入uptime命令显示如下图,其中23:47:19表示现在的时间,up 260 days,14:39表示系统运行了多久, ...
理解 Linux 的平均负载和性能监控
在本文中,我们将解释 Linux 系统中最关键的管理任务之一——关于系统 / CPU 的负载load和平均负载Load average的性能监控. 首先来看所有的类 UNIX 系统中两个重要的表述 ...
【Linux性能调优一】观大局：系统平均负载load average
要测试linux系统性能及调优,首先要从全局检查linux的平均负载 1.什么是平均负载 load average 系统平均负载,平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进程数, ...
怎么理解linux的平均负载及平均负载高后的排查工具
什么是平均负载平均负载可以对于我们来说及熟悉又陌生,但我们问平均负载是什么,但大部分人都回答说平均负载不就是单位时间内CPU使用率吗?其实并不是这样的,如果可以的话,可以 man uptime 来了 ...
linux性能分析之平均负载
平均负载 1,执行 top 或者 uptime 命令来了解系统负载 uptime 分析显示当前时间,系统运行时间,正在登录用户数平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进程 ...
Linux系统中到底应该怎么理解系统的平均负载
02 | 基础篇:到底应该怎么理解“平均负载”? 每次发现系统变慢时,我们通常做的第一件事,就是执行 top 或者 uptime 命令,来了解系统的负载情况.比如像下面这样,我在命令行里输入了 upt ...
1 理解Linux系统的“平均负载”
什么是平均负载我们知道使用top或uptime可以用来了解系统的负载情况. uptime 2 02:34:03 up 2 days, 20:14, 1 user, load average: 0.6 ...

随机推荐

top有用的开关控制命令
[原创]本文为原创博文,转发请注明出处:https://www.cnblogs.com/dingbj/p/top_command.html 今天偶然用到top命令,在动态刷新的界面上输入h顺便看了下帮 ...
Doge.jpg 的背后是什么，你知道么？
图片,是我们生活中最常见的信息载体,作为一个日常生活中无处不在的事物,我们已经很习惯静态或者动态的图片了.大家也了解静态图片主要是jpg/png格式,动态图片主要为 gif.那你有没有过一瞬间的疑惑: ...
python的零碎知识
1.Python代码操作git 安装 pip3 install gitpython 操作git import os from git.repo import Repo # gitpython def ...
.NetCore 在不同位置添加过滤器
前言以ParaModelValidateAttribute(参数校验)和ErrorCatch(错误捕捉)为例. 在方法上添加(局部) 这种方式比较灵活 [ParaModelValidate] [Er ...
Flink可靠性的基石-checkpoint机制详细解析
Checkpoint介绍 checkpoint机制是Flink可靠性的基石,可以保证Flink集群在某个算子因为某些原因(如异常退出)出现故障时,能够将整个应用流图的状态恢复到故障之前的某一状态,保 ...
数据备份与恢复半持久化全持久化 fork aof rdb Backing up Disaster recovery 备份容灾
Redis数据备份与恢复 - 流年晕开时光 - 博客园 https://www.cnblogs.com/deny/p/11531355.html Redis数据备份与恢复 Redis所有数据都是保存在 ...
CF976B
这是一道考验思维找规律的题,很有可做性. 正文题意一个 n * m 的矩阵,从左上角(1 , 1) 开始,先向下走直到最下方,再向右走到最右,再向上走一个,再走到最左......一直走到(1 , ...
LOJ10096掠夺计划
题目传送门:https://loj.ac/problem/10096 ----------------------------------------------------------------- ...
Mark基本语法
Markdown语法 1. 标题样式的标题在行的开头使用1-6个#,对应于标题级别1-6.例如: 2.引用在引用中再嵌套一个引用(在用">"的段落中使用"> ...
CSS3 Flex Box 弹性盒子、弹性布局
目录 1. 概要 2. justify-content 属性 3. align-items 属性 4. flex-wrap 属性 5. align-content 属性 6. 居中 7. align- ...

Linux-平均负载指数

系统平均负载

什么是平均负载

平均负载多少合理

如何观察平均负载

平均负载和CPU的使用率的区别

平均负载分析

执行CPU密集型任务

执行I/O密集型任务

大量进程调度

关于平均负载的总结

Linux-平均负载指数的更多相关文章

随机推荐

热门专题