Linux下程序时间消耗监控与统计
良好的计时器可帮助程序开发人员确定程序的性能瓶颈,或对不同算法进行性能比较。但要精确测量程序的运行时间并不容易,因为进程切换、中断、共享的多用户、网络流量、高速缓存访问及转移预测等因素都会对程序计时产生影响。
抛开这些影响因素,本文仅关注 Linux 系统中用户态程序执行时间的计算方式,即基于类 UNIX 系统的 time 命令统计一个程序或比较不同算法的时间消耗。
一
基本概念
1. 日历时间
Coordinated Universal Time(UTC)
世界协调时间(又称世界标准时间),旧称格林威治标准时间( Greenwich Mean Time, GMT )。
Calendar Time
日历时间,即从一个标准时间点到此时的时间所经过的秒数。该标准时间点因编译器而异,但对编译系统而言标准时间点不变。该编译系统中的时间对应的日历时间都通过该标准时间点衡量,故日历时间是“相对时间”。UNIX/Linux 的时间系统由 “新纪元时间( Epoch )” 开始算起,该起点指定为 1970 年 1 月 1 日凌晨 0 时 0 分 0 秒(格林威治时间)。Microsoft C/C++ 7.0 中标准时间点指定为 1899 年 12 月 31 日 0 时 0 分 0 秒,而其它版本的 Microsoft C/C++ 和所有不同版本的 Visual C++ 中标准时间点指定为 1970 年 1 月 1 日 0 时 0 分 0 秒。日历时间与时区无关。
Epoch
时间点。时间点在标准 C/C++ 中是一个整数( time_t ),它用此刻的时间和标准时间点相差的秒数(即日历时间)来表示。目前大部分 UNIX 系统采用 32 位记录时间,正值表示为 1970 年以后,负值则表示 1970 年以前。可简单地估算出所能表达的时间范围:1970±((231-1)/3600/24/365)≈[1901,2038] 年。为表示更久远的时间,某些编译器厂商引入 64 位甚至更长的整型数来保存日历时间。
2. 进程时间
进程时间也称 CPU 时间,用以度量进程使用的中央处理器资源。进程时间以时钟滴嗒计算,通常使用三个进程时间值,即实际时间(Real)、用户 CPU 时间(User)和系统 CPU 时间(Sys)。
实际时间指实际流逝的时间;用户时间和系统时间指特定进程使用的 CPU 时间。具体区别如下:
Real:是从进程开始执行到完成所经历的挂钟(wall clock)时间,包括其他进程使用的时间片(time slice)和本进程耗费在阻塞(如等待 I/O 操作完成)上的时间。该时间对应秒表(stopwatch)直接测量。
User:是进程执行用户态代码(内核外)耗费的 CPU 时间,仅统计该进程执行时实际使用的 CPU 时间,而不计入其他进程使用的时间片和本进程阻塞的时间。
Sys:是该进程在内核态运行所耗费的 CPU 时间,即内核执行系统调用所使用的 CPU 时间。
CPU 总时间(User+Sys)是 CPU 执行用户进程操作和内核(代表用户进程执行)系统调用所耗时间的总和,即该进程(包括其线程和子进程)所使用的实际 CPU 时间。若程序循环遍历数组,则增加用户 CPU 时间;若程序执行 exec 或 fork 等系统调用,则增加系统 CPU 时间。
在多核处理器机器上,若进程含有多个线程或通过 fork 调用创建子进程,则实际时间可能小于 CPU 总时间——因为不同线程或进程可并行执行,但其时间会计入主进程的 CPU 总时间。若程序在某段时间处于等待状态而并未执行,则实际时间可能大于 CPU 总时间。其数值关系总结如下:
Real < CPU,表明进程为计算密集型(CPU bound),利用多核处理器的并行执行优势。
Real ≈ CPU,表明进程为计算密集型(CPU bound),未并行执行。
Real > CPU,表明进程为 I/O 密集型(I/O bound),多核并行执行优势并不明显。
在单核处理器上,Real 时间和 CPU 时间之差,即 Real- (User+Sys) 是所有延迟程序执行的因素的总和。可估算程序运行期间的 CPU 利用率为 CpuUsage = (User + Sys) / Real * 100(%)。
在 SMP(对称多处理系统)上,该差值近似为 Real* ProcessorNum - (User + Sys)。这些因素包括:
调入程序文本和数据的 I/O 操作。
获取程序实际使用内存的 I/O 操作。
由其它程序消耗的 CPU 用时。
由操作系统消耗的 CPU 用时。
3. LInux命令
在 Linux 下,命令有几种类型,包括:
可以通过 $PATH 来找到的程序可执行文件,即文件系统中的命令;
通过 shell 内置命令 alias 创建的 Linux 别名,即用户定义的命令;
shell 程序设计中的保留字,即 shell keyword,如 if、then、fi、for、while、case、esac、else、until 等;
在 shell 脚本中写的 shell 函数;
shell 中内置的 Linux 命令,如 pwd、cd、bg、alias、history、type、source、read、exit 等,我们可以通过 Linux 内置的 type 命令来列出或检查 Linux 内置命令。
$ type pwd
pwd is a shell builtin
$ type cd
cd is a shell builtin$ type if then
if is a shell keyword
then is a shell keyword【左右滑动查看完整信息】
二
命令详解
当测试一个程序或比较不同算法时,执行时间是非常重要的,一个好的算法应该是用时最短的。所有类UNIX系统都包含 time(shell keyword),使用这个命令可以统计时间消耗。我们常用的 time 其实是一个 Shell 关键字,还有一个外部命令 /usr/bin/time,两者最主要的区别在于外部命令 /usr/bin/time 功能更强大。
$ type -a time
time is a shell keyword #time 是一个保留字(关键字)
time is /usr/bin/time #还有一个外部命令 time
【左右滑动查看完整信息】
/usr/bin/time 功能非常强大,我们可以使用 -v 参数查看打印出来比较详细的信息:
$ /usr/bin/time -v
Usage: /usr/bin/time [-apvV] [-f format] [-o file] [--append] [--verbose]
[--portability] [--format=format] [--output=file] [--version]
[--help] command [arg...]
$ /usr/bin/time -v echo "hello,time."
hello,time.
Command being timed: "echo hello,time."
User time (seconds): 0.00
System time (seconds): 0.00
Percent of CPU this job got: 63%
Elapsed (wall clock) time (h:mm:ss or m:ss): 0:00.00
Average shared text size (kbytes): 0
Average unshared data size (kbytes): 0
Average stack size (kbytes): 0
Average total size (kbytes): 0
Maximum resident set size (kbytes): 624
Average resident set size (kbytes): 0
Major (requiring I/O) page faults: 0
Minor (reclaiming a frame) page faults: 203
Voluntary context switches: 1
Involuntary context switches: 0
Swaps: 0
File system inputs: 0
File system outputs: 0
Socket messages sent: 0
Socket messages received: 0
Signals delivered: 0
Page size (bytes): 4096
Exit status: 0
【左右滑动查看完整信息】
外部命令 /usr/bin/time 一些常用参数:
使用 -o 选项将执行时间写入到文件中
/usr/bin/time -o outfile.txt ls【左右滑动查看完整信息】
使用 -a 选项追加信息
/usr/bin/time -a -o outfile.txt ls【左右滑动查看完整信息】
使用 -f 选项格式化时间输出
/usr/bin/time -f "time: %U" ls【左右滑动查看完整信息】
-f 选项后的参数:
参数 描述
%E real 时间,执行指令所花费的时间,显示格式为[小时:]分钟:秒。注意这个数字并不代表实际的 CPU 时间。
%e 执行指令所花费的时间,单位是秒。请注意这个数字并不代表实际的 CPU 时间。
%U user 时间,指令执行时在使用者模式(user mode)所花费的时间,单位是秒。
%S sys 时间,指令执行时在核心模式(kernel mode)所花费的时间,单位是秒。
%P 进程所获取的 CPU 时间百分比,这个值等于 user+system 时间除以总共的运行时间。
%C 进行计时的命令名称和命令行参数。
%D 进程非共享数据区域,以 KB 为单位。
%x 命令退出状态。
%k 进程接收到的信号数量。
%w 进程被交换出主存的次数。
%Z 系统的页面大小,这是一个系统常量,不用系统中常量值也不同。
%K 进程的平均总内存使用量(data+stack+text),单位是 KB。
%w 进程主动进行上下文切换的次数,例如等待 I/O 操作完成。
%c 进程被迫进行上下文切换的次数(由于时间片到期)。【左右滑动查看完整信息】
三
实际操作
对 echo、gzip、自己编写的 python 程序,使用 time 对时间消耗进行统计:
$ /usr/bin/time -f "%U(user) %S(system) %E(elapsed) %P(cpu) %M(max RAM KB)" echo "Hello, world."
Hello, world.
0.00(user) 0.00(system) 0:00.01(elapsed) 0%(cpu) 624(max RAM KB)
$ /usr/bin/time -f "%U(user) %S(system) %E(elapsed) %P(cpu) %M(max RAM KB)" gzip -d CONTROL5.clean.fasta.gz
3.98(user) 0.58(system) 0:04.57(elapsed) 99%(cpu) 732(max RAM KB)
$ /usr/bin/time -f "%U(user) %S(system) %E(elapsed) %P(cpu) %M(max RAM KB)" python getFileSize.py -p "/data/train/pca-plots;/data/Bioinfo/fastq" -o output_size.txt
0.03(user) 0.00(system) 0:00.04(elapsed) 100%(cpu) 7888(max RAM KB)
【左右滑动查看完整信息】
关于 time 更多详细信息,可以点击下面 "阅读原文" 进一步了解。
·end·
—如果喜欢,快分享给你的朋友们吧—
我们一起愉快的玩耍吧
本文分享自微信公众号 - 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
Linux下程序时间消耗监控与统计的更多相关文章
- Linux下精确控制时间的函数
Linux下精确控制时间的函数 在测试程序接口运行时间的时候,常用time,gettimeofday等函数,但是这些函数在程序执行的时候是耗费时间的,如果仅仅测试时间还行,但是如果程序中用到时间控制类 ...
- 性能测试分析过程(三)linux下查看最消耗CPU/内存的进程
linux下查看最消耗CPU 内存的进程 1.CPU占用最多的前10个进程: ps auxw|head -1;ps auxw|sort -rn -k3|head -10 2.内存消耗最多的前10 ...
- Linux下程序的机器级表示学习心得
Linux下程序的机器级表示学习心得 上周学习完Linux程序的机器级表示后,对于其中有些还是掌握的不太透彻.对于老师提出的关于本章一些细节的问题还是有不会,所以又重新温习了一下上周的学习内容,以下为 ...
- Linux下长时间ping网络加时间戳并记录到文本
Linux下长时间ping网络加时间戳并记录到文本 由于一些原因,比如需要检查网络之间是否存在掉包等问题,会长时间去ping一个地址,由于会输出大量的信息而且最好要有时间戳,因此我们可以使用简单的 ...
- Linux下设置时间
Linux下设置时间 提供两种最根本有效的方式,就是更改时区.这里以更改为国内上海时间例子,其他地方时区同理. 方法一 备份文件 mv /etc/localtime /etc/localtime.ba ...
- Linux下系统时间函数、DST等相关问题总结(转)
Linux下系统时间函数.DST等相关问题总结 下面这个结构体存储了跟时区相关的位移量(offset)以及是否存在DST等信息,根据所在的时区信息,很容易找到系统时间与UTC时间之间的时区偏移,另外根 ...
- linux下定位异常消耗的线程实战分析
前言: 之前分享过一篇Linux开发coredump文件分析实战分享 ,今天再来分享一篇实战文章. 在我们嵌入式linux开发过程中,开发过程中我们经常会使用多进程.多线程开发.那么多线程使用过程中, ...
- [转] Linux下程序的加载、运行和终止流程
TAG: linux, main, _start DATE: 2013-08-08 原文地址: http://blog.csdn.net/tigerscorpio/article/details/62 ...
- Linux下Java线程具体监控和其dump的分析使用----分析Java性能瓶颈[张振华-Jack]
作者:张振华(Jack) 这里对linux下.sun(oracle) JDK的线程资源占用问题的查找步骤做一个小结: linux环境下,当发现java进程占用CPU资源非常高,且又要想更进一步查出哪一 ...
- 制作Linux下程序安装包——使用脚本打包bin、run等安装包
制作简单的安装包的时候可以简单的用cat命令连接两个文件,然后头部是脚本文件,执行的时候把下面的文件分解出来就行了.一般这个后部分的文件是个压缩 包,那样,就能够打包很多文件了,在脚本中解压出来即可. ...
随机推荐
- std常用类型
std::getline 文档 std::reverse 文档 注意事项 reverse()返回值为void,是对原序列进行修改 std::vector 文档 emplace 和 emplace_ba ...
- 机器学习基础07DAY
分类算法之决策树 决策树是一种基本的分类方法,当然也可以用于回归.我们一般只讨论用于分类的决策树.决策树模型呈树形结构.在分类问题中,表示基于特征对实例进行分类的过程,它可以认为是if-then规则的 ...
- odbe简介
Odbc简介 今天工作中遇到一个问题,缺少某个数据库驱动程序,百度半天才发现原来室odbc原因,所以,就捎带学习了一下odbc, ODBC数据源中文名称:开放数据库互联英文名称:Open Databa ...
- python获取本地ip地址1
import socket def get_host_ip(): """ 查询本机ip地址 return: ip """ try: s = ...
- Java 生成海报
最近项目有个功能是生成海报 一个背景图片,一个二维码图片 将两个图片合并成一个图片. 写了一个工具类,需要的朋友自取. 1 @Component 2 public class PictureUtil ...
- Java并发(二)----初次使用多线程并行提高效率
1.并行 并行代表充分利用多核 cpu 的优势,提高运行效率. 想象下面的场景,执行 3 个计算,最后将计算结果汇总. 计算 1 花费 10 ms 计算 2 花费 11 ms 计算 3 花费 ...
- ASTAR机台(win7 p'rofessional)使用python tool中文显示异常问题解决
1.双击"computer"打开界面如下,再单击"open control panel"打开控制面板. 2.在控制面板中点击"Clock,Langua ...
- hasOwnProperty的作用、配合for in使用 、key in Object判读key
我们都知道,对象以 key|value的形式存在 它和数组一样可以遍历,对象可以通过for in 去遍历,拿到遍历对象的所有key 某些idea在使用for in 时,提示代码片段中就有出现以下这种情 ...
- 为HttpClient开启HTTP/2
.Net Core在调用其他服务时,调用通常使用HttpClient,而HttpClient默认使用HTTP/1.1 . 配置 HttpClient 以使用 HTTP/2 h2 连接 自 .NET C ...
- [Pytorch框架] 1.2、Pytorch环境搭建
文章目录 1.2 Pytorch环境搭建 1.2.1 安装Pytorch 1.2.2 配置 Jupyter Notebook 1.2.3 测试 1.2.4 问题解决 问题1:启动python提示编码错 ...