awk文本过滤的基本用法

1)基本操作方法

格式:awk [选项] '[条件]{指令}' 文件

其中,print 是最常用的编辑指令;若有多条编辑指令,可用分号分隔。

Awk过滤数据时支持仅打印某一列,如第2列、第5列等。

处理文本时,若未指定分隔符,则默认将空格、制表符等作为分隔符。

[root@svr5 ~]# awk '{print $1,$3}' test.txt            //打印文档第1列和第3列

[root@svr5 ~]# awk -F: '{print $1,$7}' /etc/passwd    //输出passwd文件中以分号分隔的第1、7个字段,显示的不同字段之间以逗号隔开

[root@svr5 ~]# awk -F [:/] '{print $1,$10}' /etc/passwd   //awk还识别多种单个的字符,比如以“:”或“/”分隔,输出第1、10个字段:

 

awk常用内置变量:

  $0 文本当前行的全部内容

  $1 文本的第1列

  $2 文件的第2列

  $3 文件的第3列,依此类推

  NR 文件当前行的行号

  NF 文件当前行的列数(有几列)

[root@svr5 ~]# awk -F: '{print NR,NF}' passwd.txt    //输出每次处理行的行号,以及当前行以“:”分隔的字段个数(有几列):

[root@svr5 ~]# awk -F: '{print $1,"的解释器:",$7}' /etc/passwd  //awk的print指令不仅可以打印变量,还可以打印常量

[root@svr5 ~]# ifconfig eth0 | awk '/RX packets/{print $5}'     //过滤接收数据的流量

[root@svr5 ~]# ifconfig eth0 | awk '/TX packets/{print $5}'        //过滤发送数据的流量

[root@svr5 ~]# df -h / | tail -1 | awk '{print $6}'

[root@svr5 ~]# awk '/Failed/{print $11}' /var/log/secure      //根据/var/log/secure日志文件,过滤远程连接密码失败的IP地址

awk处理的时机

awk会逐行处理文本,支持在处理第一行之前做一些准备工作,以及在处理完最后一行之后做一些总结性质的工作。在命令格式上分别体现如下:

  1. awk [选项] '[条件]{指令}' 文件
  2. awk [选项] ' BEGIN{指令} {指令} END{指令}' 文件
  • BEGIN{ } 行前处理,读取文件内容前执行,指令执行1次
  • { } 逐行处理,读取文件过程中执行,指令执行n次
  • END{ } 行后处理,读取文件结束后执行,指令执行1次

只做预处理的时候,可以没有操作文件,比如:

  1. [root@svr5 ~]# awk 'BEGIN{A=24;print A*2}'
  2. [root@svr5 ~]# awk 'BEGIN{print x+1}' #x可以不定义,直接用,默认值位0
  3. [root@svr5 ~]# awk 'BEGIN{print 3.2+3.5}'

(统计系统中使用bash作为登录Shell的用户总个数):

a.预处理时赋值变量x=0

b.然后逐行读入/etc/passwd文件,如果发现登录Shell是/bin/bash则x加1

c.全部处理完毕后,输出x的值即可。相关操作及结果如下:

  1. [root@svr5 ~]# awk 'BEGIN{x=0}/bash$/{x++} END{print x}' /etc/passwd

格式化输出/etc/passwd文件

要求: 格式化输出passwd文件内容时,要求第一行为列表标题,中间打印用户的名称、UID、家目录信息,最后一行提示一共已处理文本的总行数,

[root@svr5 ~]# awk -F: 'BEGIN{print "User\tUID\tHome"} {print $1 "\t" $3 "\t" $6} END{print "Total",NR,"lines."}' /etc/passwd

 使用正则设置条件

[root@svr5 ~]# awk -F: '/bash$/{print}' /etc/passwd         #输出其中以bash结尾的完整记录

[root@svr5 ~]# awk -F: '/root/' /etc/passwd            #输出包含root的行

[root@svr5 ~]# awk -F: '/^(root|adm)/{print $1,$3}' /etc/passwd   #输出root或adm账户的用户名和UID信息

[root@svr5 ~]# awk -F: '$1~/root/' /etc/passwd          #输出账户名称包含root的基本信息(第1列包含root)

[root@svr5 ~]# awk -F: '$7!~/nologin$/{print $1,$7}' /etc/passwd   #输出其中登录Shell不以nologin结尾(对第7个字段做!~反向匹配)的用户名、登录Shell信息

使用数值/字符串比较设置条件

比较符号:==(等于) !=(不等于) >(大于)

>=(大于等于) <(小于) <=(小于等于)

[root@svr5 ~]# awk -F: 'NR==3{print}' /etc/passwd      #输出第3行(行号NR等于3)的用户记录

[root@svr5 ~]# awk -F: '$3>=1000{print $1,$3}' /etc/passwd  #输出账户UID大于等于1000的账户名称和UID信息

[root@svr5 ~]# awk -F: '$3<10{print $1,$3}' /etc/passwd    #输出账户UID小于10的账户名称和UID信息

[root@svr5 ~]# awk -F: '$1=="root"' /etc/passwd         #输出用户名为‘root’的行

逻辑测试条件

[root@svr5 ~]# awk -F: '$3>10 && $3<20' /etc/passwd      #输出账户UID大于10并且小于20 的账户信息

[root@svr5 ~]# awk -F: '$3>1000 || $3<10' /etc/passwd       #输出账户UID大于1000或者账户UID小于10 的账户信息

数学运算

[root@svr5 ~]# awk 'BEGIN{x++;print x}'

[root@svr5 ~]# awk 'BEGIN{x=8;print x+=2}'

[root@svr5 ~]# awk 'BEGIN{x=8;x--;print x}'

[root@svr5 ~]# awk 'BEGIN{print 2+3}'

[root@svr5 ~]# awk 'BEGIN{print 2*3}'

[root@svr5 ~]# awk 'BEGIN{print 2*3}'

[root@svr5 ~]# awk 'BEGIN{ print 23%8}'

[root@svr5 ~]# seq 200 | awk '$1%3==0'     //找200以内3的倍数

[root@svr5 ~]# awk -F: '$3>=1 && $3<=1000' /etc/passwd    #列出UID间于1~1000的用户详细信息

[root@svr5 ~]# awk -F: '/^(127|192)/' /etc/hosts         #输出/etc/hosts映射文件内以127或者192开头的记录

[root@svr5 ~]# seq 100 | awk '$1%7==0||$1~/7/'          #列出100以内整数中7的倍数或是含7的数

awk工具的基本用法的更多相关文章

  1. shell脚本 awk工具

    awk工具概述awk编程语言/数据处理引擎基于模式匹配检查输入文本,逐行处理并输出通常在shell脚本中,或取指定的数据单独用时,可对文本数据做统计 命令格式格式一:awk [选项] '[条件]{编辑 ...

  2. [转帖]Linux中awk工具的使用

    Linux中awk工具的使用 2018年10月09日 17:26:20 谢公子 阅读数 2170更多 分类专栏: linux系统安全   版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权 ...

  3. MySQL的mysqldump工具的基本用法

    导出要用到MySQL的mysqldump工具,基本用法是:    shell> mysqldump [OPTIONS] database [tables]    如果你不给定任何表,整个数据库将 ...

  4. shell编程系列21--文本处理三剑客之awk中数组的用法及模拟生产环境数据统计

    shell编程系列21--文本处理三剑客之awk中数组的用法及模拟生产环境数据统计 shell中的数组的用法: shell数组中的下标是从0开始的 array=("Allen" & ...

  5. 【转载】GAWK AWK工具使用手册

    IBM GAWK入门资料http://www.ibm.com/developerworks/cn/education/aix/au-gawk/ AWK 是什么? 最简单地说,AWK 是一种用于处理文本 ...

  6. awk下 gsub函数用法

     (2012-03-27 01:37:28) 标签: awk gsub linux 函数 it 分类: linux gsub函数则使得在所有正则表达式被匹配的时候都发生替换 gsub(regular ...

  7. AWK工具的用法

    基本格式 awk '{commands}' filename 或者 stdin | awk '{commands}' 以下,均简写为awk '{commands}'的形式 commands的用法 co ...

  8. awk工具

    简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再 ...

  9. linux中awk工具的使用(转)

    add by zhj: awk很强大,它是一个简单的编程语言,国外有本专门的书介绍它的用法.<effective awk programming>,它支持整型,字符串型,数组,变量在使用前 ...

随机推荐

  1. 多线程锁:Mutex互斥体,Semaphore信号量,Monitor监视器,lock,原子操作InterLocked

    Mutex类 “mutex”是术语“互相排斥(mutually exclusive)”的简写形式,也就是互斥量.互斥量跟临界区中提到的Monitor很相似,只有拥有互斥对象的线程才具有访问资源的权限, ...

  2. kubectl 自动补全

    kubectl 这个命令行工具非常重要,与之相关的命令也很多,我们也记不住那么多的命令,而且也会经常写错,所以命令自动补全是很有必要的,kubectl 工具本身就支持自动补全,只需简单设置一下即可. ...

  3. 程序装载:“640K内存”真的不够用么?

    本文源于size_t的说明,看到比尔盖茨说过:640K内存对于任何人来说都足够了,所以找了一篇文章,学习一下~~ 一直以来都知道自己有关计算机底层的知识不是不扎实,前段时间跟着大佬们推荐在[极客时间] ...

  4. Jekyll添加FancyBox 插件

    一.简要 这是之前在GitHub Page上面使用博客功能的完善,之前每次传到GitHub上面的图片在博客里面都是显示压缩后的,导致很多代码细节都看不清. Markdown 语法中的图片我们一般是如此 ...

  5. JQuery-UI组件化开发

    ===================== 页面相关样式及其脚本的引入先后顺序,如下: 1,layout.css 页面的静态基本框架布局样式 2,base.css 页面的静态细节样式 3,ui.css ...

  6. 获取bin目录

    System.AppDomain.CurrentDomain.SetupInformation.ApplicationBase;//获取bin\Debug\目录System.AppDomain.Cur ...

  7. 003_linuxC++之_namespace使用

    (一)引入namespace原因: 假如有很多跟人共同完成一项工程,工程中难免会有函数定义一样的名称,不可能一个一个的询问这个函数 你定义过了没有,所以引入namespace #include < ...

  8. Bzoj 1086: [SCOI2005]王室联邦(分块)

    1086: [SCOI2005]王室联邦 Time Limit: 10 Sec Memory Limit: 162 MBSec Special Judge Submit: 1557 Solved: 9 ...

  9. bbs-admin-自定义admin(二)

    本文内容 目的:模仿admin默认配置,自定义配置类 一 查 1 查看数据 2 查看表头 3 分页器 4 search(搜索框)   5 action(批量处理)    6 filter(分类)   ...

  10. 2Dot grammar

    http://www.cnblogs.com/mjios/archive/2013/04/08/3006577.html . #import <Foundation/Foundation.h&g ...