Linux系统中,平均负载是指单位时间内,处于可运行状态和不可中断状态的进程数。它不仅包括了正在使用CPU的进程,也包括处于不可打断的睡眠状态的进程—它们是在等待其它系统资源如磁盘 I/O 等的进程。而CPU使用率,是单位时间内CPU繁忙情况的统计,跟平均负载并不一定完全对应。
有诸多方式监测系统平均负载,比如最常用的uptimetop工具:

uptime命令

uptime会显示系统运行时间、用户数量及平均负载:

$ uptime
20:53:21 up 2:19, 3 users, load average: 0.07, 0.02, 0.00

平均负载的数字从左到右的含义依次为:

  • 最近 1 分钟的平均负载为 0.07
  • 最近 5 分钟的平均负载为 0.02
  • 最近 15 分钟的平均负载为 0.00

top命令

top命令可以实时的显示Linux系统的运行状态:

$ top

下面是系统进程状态的显示:

top - 21:01:32 up  2:27,  2 users,  load average: 0.03, 0.02, 0.00
Tasks: 261 total, 1 running, 190 sleeping, 0 stopped, 0 zombie
%Cpu(s): 1.0 us, 1.5 sy, 0.0 ni, 97.5 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 8144440 total, 5453688 free, 939500 used, 1751252 buff/cache
KiB Swap: 7810044 total, 7810044 free, 0 used. 6794636 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

5834 f1dev 20 0 610168 107712 78048 S 1.7 1.3 0:04.87 chrome

2150 f1dev 20 0 1190912 116464 81708 S 1.0 1.4 0:14.88 compiz

5801 f1dev 20 0 771976 158536 113124 S 1.0 1.9 0:07.18 chrome

第一行的队列信息和uptime命令的输出完全一致。

系统平均负载和CPU核心数的关系

可以使用nproclscpu或者grep命令查看系统中的处理器数量:

$ nproc
2
或者
$ lscpu
或者
$ grep 'model name' /proc/cpuinfo | wc -l
2

假设系统负载如下:

$ uptime
20:53:21 up 2:19, 3 users, load average: 1.00, 0.40, 3.35

如果一个单CPU系统上表示在过去一分钟内系统刚好满载运行;在5分钟内CPU有 60%处于空闲状态;而在15分钟内,有235%的超载。
如果是在一个双核系统中表示在过去一分钟内系统有一个CPU处于完全空闲状态,另一个CPU被使用;在5分钟内,CPU平均160% 处于空闲状态;而在15分钟内,有135%的超载,也就是说最近的 15 分钟平均有1.35个进程等待CPU时间。

平均负载案例分析

首先安装stresssysstat工具:

# stress:一个Linux系统压力测试工具。
# sysstat:监控和分析系统的性能工具,包括mpstat(cpu详细信息)、pidstat(进程性能分析)命令、iostat等。
$ sudo apt install stress sysstat

同一个Linux系统打开三个终端,在第一终端模拟CPU使用率100%场景:

$ stress --cpu 1 --timeout 600
stress: info: [6684] dispatching hogs: 1 cpu, 0 io, 0 vm, 0 hdd

第二个终端运行uptime

# -d 参数表示高亮显示变化的区域
$ watch -d uptime
21:40:12 up 3:06, 4 users, load average: 1.00, 0.50, 0.20

在第三个终端运行 mpstat 查看 CPU 使用率的变化:

# -P ALL 表示监控所有 CPU,后面数字 5 表示间隔 5 秒后输出一组数据
$ mpstat -P ALL 5
21时40分01秒 CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle
21时40分06秒 all 50.45 0.30 0.50 0.00 0.00 0.00 0.00 0.00 0.00 48.75
21时40分06秒 0 100.00 0.60 0.60 0.00 0.00 0.00 0.00 0.00 0.00 4.40
21时40分06秒 1 6.02 0.00 0.60 0.00 0.00 0.00 0.00 0.00 0.00 93.37

从终端二看到1分钟的平均负载会慢慢增加到1.00;终端三正好有一个CPU使用率为100%,但它的iowait只有0,说明平均负载的升高正是由于CPU使用率的升高。
那么到底是哪个进程导致CPU使用率为100%,可以使用top命令来或使用pidstat命令来查看:

# 间隔 5 秒后输出一组数据
$ pidstat -u 5 1
Average: UID PID %usr %system %guest %CPU CPU Command
Average: 1000 6685 100.00 0.00 0.00 99.60 - stress

从这里可以明显看到,stress 进程的 CPU 使用率为 100%。

文章知识点与官方知识档案匹配,可进一步学习相关知识
CS入门技能树Linux入门初识Linux31175 人正在系统学习中

[转帖]Linux性能分析:理解系统平均负载的更多相关文章

  1. Linux性能调优 | 01 平均负载的理解和分析

    01 uptime命令 通常我们发现系统变慢时,我们都会执行top或者uptime命令,来查看当前系统的负载情况,比如像下面,我执行了uptime,系统返回的了结果. [root@lincoding ...

  2. Linux性能优化-理解平均负载

    1 平均负载含义 当系统变慢的时候,我们一般使用 top 或 uptime 命令来查看系统平均负载情况. 正确定义:单位时间内,系统中处于可运行状态和不可中断状态的平均进程数.错误定义:单位时间内的c ...

  3. 【Linux性能调优一】观大局:系统平均负载load average

    要测试linux系统性能及调优,首先要从全局检查linux的平均负载 1.什么是平均负载 load average 系统平均负载,平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进程数, ...

  4. 【转】一文掌握 Linux 性能分析之 I/O 篇

    [转]一文掌握 Linux 性能分析之 I/O 篇 这是 Linux 性能分析系列的第三篇,前两篇分别讲了 CPU 和 内存,本篇来看 IO. IO 和 存储密切相关,存储可以概括为磁盘,内存,缓存, ...

  5. 【原创】一文掌握 Linux 性能分析之 I/O 篇

    本文首发于我的公众号 Linux云计算网络(id: cloud_dev),专注于干货分享,号内有 10T 书籍和视频资源,后台回复「1024」即可领取,欢迎大家关注,二维码文末可以扫. 一文掌握 Li ...

  6. linux系统平均负载高(load average)

    系统平均负载高(load average) 问题现象 两个案例都是:系统平均负载高,但cpu,内存,磁盘io都正常 什么是系统平均负载 平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进 ...

  7. Linux性能分析工具top命令详解

    top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,常用于服务端性能分析. top命令说明 [www.linuxidc.com@linuxidc-t-tomcat-1 ...

  8. 【转】一文掌握 Linux 性能分析之网络篇

    [转]一文掌握 Linux 性能分析之网络篇 比较宽泛地讲,网络方向的性能分析既包括主机测的网络配置查看.监控,又包括网络链路上的包转发时延.吞吐量.带宽等指标分析.包括但不限于以下分析工具: pin ...

  9. 一文掌握 Linux 性能分析之网络篇

    本文首发于我的公众号 Linux云计算网络(id: cloud_dev),专注于干货分享,号内有 10T 书籍和视频资源,后台回复「1024」即可领取,欢迎大家关注,二维码文末可以扫. 这是 Linu ...

  10. Linux 性能分析工具汇总合集

    出于对Linux操作系统的兴趣,以及对底层知识的强烈欲望,因此整理了这篇文章.本文也可以作为检验基础知识的指标,另外文章涵盖了一个系统的方方面面.如果没有完善的计算机系统知识,网络知识和操作系统知识, ...

随机推荐

  1. SVN工具基础知识

    SVN工具基础知识 1.简介 1.全称Subversion,是一个开放源代码的版本控制系统,Subversion 在 2000 年由 CollabNet Inc 开发,现 在发展成为 Apache 软 ...

  2. STM32CubeMX教程14 ADC - 多通道DMA转换

    1.准备材料 开发板(正点原子stm32f407探索者开发板V2.4) ST-LINK/V2驱动 STM32CubeMX软件(Version 6.10.0) keil µVision5 IDE(MDK ...

  3. PPT 放映电脑Office版本低怎么办

    转换成全图形PPT 转成图片,无法放动画 转换成全视频 转成视频,无法控制节奏 PPT VIEWEB 本地PPT播放工具

  4. Jenkins Pipeline 流水线 - Parameters 参数化构建

    可以通过参数的方式,指定构建的版本 有两种方式 界面添加 Pipeline Script 脚本配置 (需要Build 一次,然后生效,不知道有没有其它办法) General 界面添加 Pipeline ...

  5. 使用 FHE 实现加密大语言模型

    近来,大语言模型 (LLM) 已被证明是提高编程.内容生成.文本分析.网络搜索及远程学习等诸多领域生产力的可靠工具. 大语言模型对用户隐私的影响 尽管 LLM 很有吸引力,但如何保护好 输入给这些模型 ...

  6. sqlalchemy 报错 Lost connection to MySQL server during query 解决

    最近在开发过程中遇到一个sqlalchemy lost connection的报错,记录解决方法. 报错信息 python后端开发,使用的框架是Fastapi + sqlalchemy.在一个接口请求 ...

  7. Go--下载安装

    下载包地址:https://go.dev/dl/ linux: 下载后上传实例解压 tar -xvf go1.19.8.linux-amd64.tar.gz -C /usr/local/ 创建工作目录 ...

  8. 【JAVA基础】Mybatis示例

    固定时间范围查询 <select id="selectPaidList" resultType="com.hand.htms.ifp.entity.IfpShipm ...

  9. 深入理解 Serverless 计算的并发度

    作者|西流(阿里云技术专家) 背景 2019 年 Berkeley 预测 Serverless 将取代 Serverful 计算[1],成为云计算的计算新范式.Serverless 为应用程序开发提供 ...

  10. 3 分钟创建 Serverless Job 定时获取新闻热搜

    不用掏手机,不用登微博,借助 SAE 定时任务就可以实现每小时获取实时新闻热搜!SAE 场景体验火热开启中,参与还可领好礼! Job 作为一种运完即停的负载类型,在企业级开发中承载着丰富的使用场景.S ...