转 快速理解linux文本分析利器awk

原文链接 杜亦舒 性能与架构

awk是什么

如果工作中需要操作linux比较多,那么awk是非常值得学习的

awk是一个极其强大的文本分析工具,把文件逐行的读入,以指定分隔符将每行切片,切开的部分再进行各种分析处理

可以使用awk创建程序,来读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有很多其他的功能

awk使用示例

通过一些简单的示例来认识一下awk

(1) ll | awk '{print $9}'

这个命令的结果是只显示文件名列表

工作过程

awk命令接收 ll 结果信息,并逐行处理

对每一行结果记录按空格(空格是默认分隔符)分割,并打印出第9列的信息

语法说明

单引号('')里面的部分是awk要执行的内容,花括号({})中是一个代码块,单引号中可以有多个花括号部分

print是一个输出命令

$9 表示分割结果中的第9列内容,分割结果相当于一个数组,从 0-n,$0 是没分割的整行内容,$n 是分割后的第 n 列内容

(2)awk -F ':' '{print $1"\t"$6}' /etc/passwd

上个命令是通过管道处理命令结果

这个命令是处理文件(/etc/passwd)的内容,显示出用户名、用户目录列表

passwd文件中每行内容是用 ':' 分隔的,要使用 -F 参数来指定分隔符

awk命令的尾部跟上文件名,就表示要处理这个文件

$1"\t"$6 是组织结果信息显示形式,第1列内容 + tab + 第6列内容

(3)awk -F: '/root/{print $0}' /etc/passwd

上两个命令是处理每一行记录,如果想过滤出自己关注的记录,可以使用匹配模式

这个命令就是对每行进行匹配,如果这一行信息中含有 root,才执行后面{}中的命令

双斜杠(/.../)中支持正则表达式,例如匹配以 root 开头的行

awk -F: '/^root/{print $0}' /etc/passwd

(4)awk -F ':' '{print "filename:" FILENAME ",linenumber:" NR ",columns:" NF ",linecontent:"$0}' /etc/passwd

awk还内置了一些有用的变量,例如这个命令中打印出了

‘文件名’ - FILENAME

‘行号’ - NR

‘列号’ - NF

(5)awk -F ':' 'BEGIN {print "header"} {print $1} END {print "foot"}' /etc/passwd

这个命令中多了两个新部分:

BEGIN {print "header"}

END {print "foot"}

BEGIN 是开始处理前的动作,END 是处理后的动作

工作流程

1)先执行BEGING

对应此例中的 BEGIN {print "header"}

2)读取文件,取得第一行进行分割,然后执行动作,对应此例中的 {print $1},直至处理完每一行

3)执行END操作

对应此例中的 END {print "foot"}

(6)ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print size/1024/1024,"M"}'

此命令统计文件夹下的文件总大小,以M为单位

此例中新增了一个概念:变量

在起始部分 BEGIN {size=0;} 中,定义了一个变量,名为 size,初始化为 0

在每行对应的处理动作为 {size=size+$5;},对size变量值进行累加

在结束部分 END{print size/1024/1024,"M"} 中,对 size 值转换为M,然后打印出来

(7)ls -l |awk 'BEGIN {size=0;} {if($5!=4096){size=size+$5;}} END{print size/1024/1024,"M"}'

此命令在上个例子的基础上过滤掉了文件夹的大下

过滤是通过条件判断来实现的,文件夹的大小为 4096

awk中的条件语句是从C语言中借鉴来的,支持 if、while、do/while、for、break、continue

---

通过上面的几个例子,已经可以看到awk的概貌,也可以理解了为什么awk这么强大,它有内置变量、可以自定义变量、支持条件判断语句、支持正则表达式…… 可以视为一门语言了

awk还有很多其他高级用法,有兴趣的话可以深入学习一下

linux文本分析利器awk的更多相关文章

  1. Linux文本分析命令awk的妙用

    基本用法 awk是一个强大的文本分析工具,简单来说awk就是把文件逐行读入,(空格,制表符)为默认分隔符将每行切片,切开的部分再进行各种分析处理 awk命令格式如下 awk [-F field-sep ...

  2. linux 文本分析工具---awk命令(7/1)

    awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各 ...

  3. 《Linux 文本处理》- awk 分析 nginx 日志

    废话不多说,简单了解一下 awk - 强大的文本分析工具,也就是分析日志 最常用的就是分析日志了吧,做统计什么,这里也拿 nginx 日志来做分析 1:统计出现次数 - 比如状态码出现次数 - 先直接 ...

  4. Linux文本处理命令 -- awk

    简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再 ...

  5. 文本分析工具awk简单示例

    先创建一个文件:vim hi 取第2个字段和第3个字段: awk '{print $2,$3}' hi     注意{}中的,逗号会在输出的时候转变为空格 加入字符说明: 显示整行: 指定字段分隔符: ...

  6. Linux性能分析利器——火焰图的安装使用

    火焰图(flame graph)是性能分析的利器,通过它可以快速定位性能瓶颈点. perf 命令(performance 的缩写)是 Linux 系统原生提供的性能分析工具,会返回 CPU 正在执行的 ...

  7. Linux 文本三剑客之 awk

    Linux 系统中一切皆文件. 文件是个文本.可以读.可以写,如果是二进制文件,还能执行. 在使用Linux的时候,大都是要和各式各样文件打交道.熟悉文本的读取.编辑.筛选就是linux系统管理员的必 ...

  8. Linux 之 awk文本分析工具

    AWK是一种处理文本文件的语言,是一个强大的文本分析工具.Linux环境中自带. awk调用方法 命令行 awk [-F field-separator] 'commands' input-file( ...

  9. Linux文本三剑客超详细教程---grep、sed、awk

    awk.grep.sed是linux操作文本的三大利器,合称文本三剑客,也是必须掌握的linux命令之一.三者的功能都是处理文本,但侧重点各不相同,其中属awk功能最强大,但也最复杂.grep更适合单 ...

随机推荐

  1. mysqldumper

    介绍 MySQL自身的mysqldump工具支持单线程工作,依次一个个导出多个表,没有一个并行的机,这就使得它无法迅速的备份数据. mydumper作为一个实用工具,能够良好支持多线程工作,可以并行的 ...

  2. 你家的Wifi密码安全吗?

    WiFi在给我们提供方便的无线网络同时,也带了一些隐患.如果对WiFi不设密码的话,一来会因为蹭网而影响网速,二来给信息安全带来了不小隐患.针对WiFi的安全手段,一般来说就是加密.最初的加密方式是W ...

  3. 基于tiny4412的Linux内核移植 -- MMA7660驱动移植(九)

    作者信息 作者: 彭东林 邮箱:pengdonglin137@163.com QQ:405728433 平台简介 开发板:tiny4412ADK + S700 + 4GB Flash 要移植的内核版本 ...

  4. Linux命令之sync - 强制将内存中的文件缓冲内容写到磁盘

    转:http://www.linuxso.com/command/sync.html sync命令 linux同步数据命令 格式: sync 用途:更新 i-node 表,并将缓冲文件写到硬盘中. 功 ...

  5. DN安卓2014版(5-9)

    DN安卓2014版(5-9) 联系2g32@sina.com

  6. 四种有能力取代Cookies的客户端Web存储方案

    目前在用户的网络浏览器中保存大量数据需要遵循几大现有标准,每一种标准都拥有自己的优势.短板.独特的W3C标准化状态以及浏览器支持级别.但无论如何,这些标准的实际表现都优于广泛存在的cookies机制. ...

  7. jquery中remove()与detach()的区别

    说到删除节点,马上就会想到remove,不过原来还有一个detach,而且它们还是有区别的,就是detach保留了jquery的数据,而remove就会完全删除干净.所以如果在删除一个dom节点后还想 ...

  8. RenderMonkey 练习 第二天 【opengl 光照模型】

    光照模型 3D渲染中, 物体表面的光照计算公式为: I = 环境光(Iambient) + 漫反射光(Idiffuse) + 镜面高光(Ispecular); 其中,环境光(ambient)计算公式为 ...

  9. jquery触发/失去焦点事件

    触发焦点: $("Element").focus() 触发每一个匹配元素获得焦点事件. $("Element").focus(function) 事件会在获得焦 ...

  10. Win7如何开启Telnet服务

    http://jingyan.baidu.com/article/870c6fc3cd6fa9b03fe4bee4.html telnet 192.168.1.10 2181