标题:awk命令的使用

作用:awk是非常好用的数据处理工具,主要处理每一行的字段内的数据,默认的字段的分割符为空格键或[tab]键

一、awk脚本的基本结构:

  awk 'BEGIN{print "start"} pattern {commands} END{print "ends"}' file // 一个awk脚本通常由:BEGIN语句块、能够使用模式匹配的通用语句块、END语句块3部分组成,这三部分是可选的,任意一部分都可以不出现在脚本中

                                                         //通常是被单引号或双引号括住的

例如: awk 'BEGIN{i=0}{i++}END{print i}' filename

      awk "BEGIN{i=0}{i++}END{print i}" filename

二、awk的执行过程

       awk 'BEGIN {commands} pattern{commands}END{commands}' filename

   [1]第一步:执行BEGIN{commands} 语句块中的语句;

   [2]第二步:从文件或标准输入(stdin)读取一行,然后执行pattern{commands}语句块,它逐行扫描文件,第一行到最后一行重复这个过程,直到文件全部被读取完毕;

   [3]第三步:当读至输入流末尾时候,执行END{commands}语句块

BEGIN语句块在awk开始从输入流中读取行之前被执行,这是一个可选的语句块。比如变量的初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中。

END语句块在awk从输入流读取完所有的行之后执行,比如打印所有行的分析结果这类信息汇总都是在END语句块中完成。

三、awk内置变量

           [1]$n 是当前行的按照指定域分隔符(默认是空格或[TAB]]键)分割后的第n个字段,比如n为1 表示第1个字段,n为2表示第2个字段

    [2]$0 则是记录了执行过程中当前行的文本内容

[3]NF 每一行($0)拥有的字段总数

[4]NR 目前awk所处理的"第几行"数据

[5]FNR 表示当前所处理的文本内的"第几行"数据

[6]FS 目前的域分割符号,可以通过FS字段指定文本的域分割符

[7]OFS 输出字段的分割符(默认是一个空格)

       [8]ORS 输出的记录分割符(默认是一个换行)

[9]ARGIND 命令行中处理的当前文件的位置(从1开始)

[10]ARGC 命令行参数的数目

[11]ARGV 命令行参数的数组

四、awk实例

    例1:pay.txt文件内容格式:姓名、第一个月工资、第二个月工资、第三个月工资,将每一个人的三月工资总和计算出来

Name     1st      2nd         3th

    VBird     2300   3400      2500

     Bmtsai   2000   2000      2300

     Bird2     4300   4200      4100

命令:awk 'NR==1{printf ("%10s%10s%10s%10s%10s\n", $1, $2, $3, $4,"Total")} NR>=2{total=$2+$3+$4; printf ("%10s%10s%10s%10s%10s\n", $1, $2, $3, $4,total)}' pay.txt

输出:

     解释:NR表示当前处理的行数(行号),如果满足NR==1即处理的是第一行的内容Name 1st 2nd 3th,就执行后面的括弧中的打印(printf)命令;如果满足NR>=2那么就会执行第一个括弧中的命令{total=$2+$3+$4; printf   

("%10s%10s%10s%10s%10s\n", $1, $2, $3, $4,total)}。所以,awk命令格式中的pattern决定了是否对当前输入的行执行其后面的commands。

例2:将a.dat的第一列内容和第二列内容相加

a.dat内容:    b.dat内容:

      

命令: awk 'BEGIN{i=0;j=0}FNR==NR{array[i++]=$1;next}{total=array[j]+$1;print array[j],$1,total;j++}' a.dat b.dat

          或awk 'BEGIN{i=0;j=0}ARGIND==1{array[i++]=$1}ARGIND==2{total=array[j]+$1;print array[j],$1,total;j++}' a.dat b.dat

    输出结果:

解释:NR和FNR是awk内置变量,表示行号,NR表示处理的记录的行数,FNR表示当前处理的文件的行数,因为awk的参数可以同时跟多个文件名并且按照其出现的顺序逐个输入并处理,而NR              表示截止当前处理的总的行数,而FNR表示当前所处理的文

件的行数。能能够导致读入下一个输入行,并返回到脚本的顶部,这可以避免对当前输入行执行其他的操作过程。

例3:去除重复记录——假设某文件test.da记录如下:

命令:awk ' !a[$0]++{print $0}' test.da

   输出:

解释:awk默认数组的初始值是0,当记录已经出现在的数组a中的时候,那么!a[$0]为假,所以就不会执行后面的print $0

Linux常用命令之awk的更多相关文章

  1. 【操作系统之四】Linux常用命令之awk

    一.概念awk是一个报告生成器,拥有强大的文本格式化能力. 数据可以来自标准输入(stdin).一个或多个文件,或其它命令的输出: 依次对每一行进行处理,然后输出: 它在命令行中使用,但更多是作为脚本 ...

  2. linux 常用命令大全

    linux 常用命令大全 系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统 ...

  3. linux 常用命令及技巧

    linux 常用命令及技巧 linux 常用命令及技巧:linux 常用命令总结: 一. 通用命令: 1. date :print or set the system date and time 2. ...

  4. 最近用到的Linux常用命令总结

    最近用到的Linux常用命令总结 - ls :显示当前目录文件信息 `ls -a -l` - cd :目录跳转 cd .. 上级目录 cd ~ home目录 cd - 最近目录 - cat :在屏幕上 ...

  5. Linux 常用命令使用方法大搜刮

    Linux 常用命令使用方法大搜刮 1.# 表示权限用户(如:root),$ 表示普通用户  开机提示:Login:输入用户名  password:输入口令   用户是系统注册用户成功登陆后,可以进入 ...

  6. linux常用命令 、查看日志、web排查

    linux常用命令 ps aux|grep xxx (比如 ps aux|grep tomcat ps aux|grep tomcat-portalvip ps aux|grep nginx 等) r ...

  7. 100个命令Linux常用命令大全

    Linux常用命令大全100条: 1,echo "aa" > test.txt 和 echo "bb" >> test.txt//>将原 ...

  8. Linux常用命令大全(非常全!!!)

    Linux常用命令大全(非常全!!!) 最近都在和Linux打交道,感觉还不错.我觉得Linux相比windows比较麻烦的就是很多东西都要用命令来控制,当然,这也是很多人喜欢linux的原因,比较短 ...

  9. 【转载】Linux常用命令

    Linux常用命令大全(非常全!!!) 转载出处:https://www.cnblogs.com/yjd_hycf_space/p/7730690.html 系统信息 arch 显示机器的处理器架构( ...

随机推荐

  1. Bluetooth in Android 4.2 and 4.3(一):综述

    从Android 4.2开始,Bluetooth stack发生了重大改变:从Bluez换成了由Google和Broadcom联合开发的Bluedroid(当然,核心的部分还是Broadcom的,Go ...

  2. python sleep

    Python Sleep休眠函数 Python 编程中使用 time 模块可以让程序休眠,具体方法是time.sleep(秒数),其中"秒数"以秒为单位,可以是小数,0.1秒则代表 ...

  3. css 关于两栏布局,左边固定,右边自适应

    好几个星期都没写博客了,最近不忙也不闲,稀里糊涂过了两个星期,之前几个月内天天坚持签到.最近也没签到.哈哈,说正事. 今天做东钿互金平台后台页面,昨天做了一个登录页面,业偶碰到了一个难题.等下也要把它 ...

  4. IE6 背景透明

    IE6 背景透明 第 1 种方法:定义一个样式,给某个div应用这个样式后,div的透明png背景图片自动透明了.(注意两处图片的路径写法不一样,本例中,icon_home.png图片与html文件在 ...

  5. Release 版本和 Debug 版本

    什么是 Release 版本.Debug 版本? bug-缺陷,程序故障.而debug指的是排除缺陷,显然这个模式是面向开发者的. 而release是满足发布所用. Debug 和 Release,在 ...

  6. [转]Kerberos简介

    Kerberos协议: Kerberos协议主要用于计算机网络的身份鉴别(Authentication), 其特点是用户只需输入一次身份验证信息就可以凭借此验证获得的票据(ticket-grantin ...

  7. MFC 构建、消亡 顺序 (二)--多文档 (MDI)

    MFC 构建.消亡 顺序 (二)--多文档 (MDI) by:http://www.cnblogs.com/vranger/ (一)MDI 生成顺序 (二)打开文档-“Open” (三)新建文档-“N ...

  8. perl学习笔记(2)

    1)记得刚开始写perl的时候,对于一个功能,总是拿目前能用的数据类型来解决问题,不想想有没有更好的,能用能解决问题就好,这就导致了后期,要在函数里面添加功能的时候,函数要添加很多参数,一个函数有7. ...

  9. constraint使用方法总结

    主要就是添加约束的 下面几种约束 .并 一一列举: 1.主键约束: 要对一个列加主键约束的话,这列就必需要满足的条件就是分空 由于主键约束:就是对一个列进行了约束,约束为(非空.不反复) 下面是代码  ...

  10. 转换到 COFF 期间失败: 文件无效或损坏 解决方法

    转自csdn 终极解决方案:VS2010在经历一些更新后,建立Win32 Console Project时会出“error LNK1123” 错误,解决方案为将 项目|项目属性|配置属性|清单工具|输 ...