GNU gawk工具的功能是将指定文件中符合指定模式(pattern)的行按指定的动作(action)进行格式化处理
语法:gawk [options] [program] [file-list]

1、program格式

'pattern {action}'

2、$1,...,$n: 第1列,...,第n列

3、~ (matches operator):包含

$ gawk '$1 ~ /h/' cars

4、关系运算符:==,<=,>=,!=,>,<

#dpkg –get-selections | gawk '$2 != "install" {print $0}'
$ gawk '$5 <= 3000' cars

5、范围运算符:,

$ gawk '/volvo/ , /bmw/' cars

6、BEGIN 模式、END模式

$ gawk 'END {print NR, "cars for sale." }' cars

7、$0: 当前行

8、length函数

$ gawk '{print length, $0}' cars | sort -n

9、NR (record number)变量

$ gawk 'length > 24 {print NR}' cars
$ gawk 'NR == 2 , NR == 4' cars

10、OFS变量:输出字段分隔符(onput field separator)

BEGIN   {OFS = " "}
{
if ($1 ~ /ply/)  $1 = "plymouth"
if ($1 ~ /chev/) $1 = "chevrolet"
print
}

11、FS: 输入字段分隔符(input field separator)

$ cat find_uid
 
BEGIN            {FS = ":"
 saveit = 0}
$3 > saveit     {saveit = $3}
END                {print "Next available UID is " saveit + 1}
 
$ gawk -f find_uid /etc/passwd
Next available UID is 192
 
$ gawk -F: '{print $2}' file;    //-F选项用来在命令行上给FS重新赋值
 
$ gawk -F[: ] '{print $2}' file //使用多个分隔符:空格、冒号:和TAB

12、printf函数

BEGIN   {
printf "%-10s %-8s    %2d   %5d     $ %8.2f",
$1, $2, $3, $4, $5
}

13、重定向输出

$ cat redirect_out
 
/chevy/    {print > "chevfile"}
 
/ford/     {print > "fordfile"}
 
END        {print "done."}
 
$ gawk -f redirect_out cars

14、if...else控制结构

$ cat price_range
 
{
if ($5 <= 5000) $5 = "inexpensive"
else if  (5000 < $5 && $5 < 10000)  $5 = "please ask"
else if  (10000 <= $5)  $5 = "expensive"
printf "%-10s %-8s    %2d    %5d    %-12s",$1, $2, $3, $4, $5
}

15、getline

读取一行,然后gawk的指针指向下一行(NR递增)。如果不带变量:行指针立即变化,NR递增,$0-$n变化;如果带变量: 行指针在{}内不变化,NR递增,$0-$n不变化
 
$ cat g4
{
print NR, "$0:", $0
getline aa
print NR, "aa:", aa
}
 
$ gawk -f g4 < alpha
 
1 $0: aaaaaaaaa
 
2 aa: bbbbbbbbb
 
3 $0: ccccccccc
 
4 aa: ddddddddd

16、其它

gawk 的|&相当于bash的管道 |
gawk能够从网络上获取文件的信息
gawk中的变量赋值后,引用变量不用$,直接引用,不同于bash。
 

=-=-=-=-=
Powered by Blogilo

gawk的用法的更多相关文章

  1. gawk(awk)的用法案例

    gawk(awk)的用法案例 本文首先简单介绍一个gawk和awk的区别,然后是一点基本使用流程,最后是自己做的一个分析数据文件的脚本代码,供大家参考.另外想了解基本流程的入门知识的可以下载附件pdf ...

  2. awk 用法(使用入门)

    转自:http://www.cnblogs.com/emanlee/p/3327576.html awk 用法:awk ' pattern {action} '  变量名    含义 ARGC   命 ...

  3. awk用法

    目前虽然有很多工具可以代替awk,但是呢我还是认为awk还是非常重要,比如有时候load数据到hive,mysql发现数据有点问题,这样可以先对比文件和库中数据是否一致,这样awk就发挥用处了,还有从 ...

  4. 测试技能积木-AWK的简要用法

    做测试工作,经常要分析日志,有的时候活儿还很脏很累,比如抽取符合某些pattern的行,重新格式化等等.有的时候,我们需要也创造一些测试用数据文件.基于上述两种原因,在Unix Like 系统上,一些 ...

  5. Linux Shell 示例精解(第七章 gawk编程)转载

    第七章 gawk功能:gawk编程 7.1.1 数字和字符串常量     初始化和类型强制  在awk中,变量不需要定义就可以直接使用,使用一个变量就是对变量的定义.变量的类型可以试数字.字符串,或者 ...

  6. AWK用法入门详解

    简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再 ...

  7. awk简单用法

    awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各 ...

  8. 《Linux命令行与shell脚本编程大全》第十九章 初识sed和gawk

    这两个工具能够极大简化需要进行的数据处理任务. 19.1 文本处理 能轻松实现自动格式化.插入.修改或删除文本元素的简单命令行编辑. sed和gawk就具备上述功能 19.1.1 sed编辑器 被称为 ...

  9. 《Linux命令行与shell脚本编程大全》第二十二章 gawk进阶

    gawk是一门功能丰富的编程语言,你可以通过它所提供的各种特性来编写好几程序处理数据. 22.1 使用变量 gawk编程语言支持两种不同类型的变量: 内建变量和自定义变量 22.1.1 内建变量 ga ...

随机推荐

  1. lightoj1281快速幂+数学知识

    https://vjudge.net/contest/70017#problem/E 后半部分快速幂就能求出来,要注意03lld不然001是输出错误为1.前半部分用log10() 对于给定的一个数n, ...

  2. Swiper使用方法

    Swiper使用方法 1.首先加载插件,需要用到的文件有swiper.min.js和swiper.min.css文件. <!DOCTYPE html> <html> <h ...

  3. 走进javascript——类型

    ECMAScript语言类型对应于使用ECMAScript语言的ECMAScript程序员直接操作的值.ECMAScript语言类型有以下几种Undefined,Null,Boolean,String ...

  4. VR全景:互联网与实体店的完美结合

     VR元年已过,VR项目.VR创业潮转为理性,VR行业分为两个方向:硬件和内容.硬件又分为VR头显和辅助设备,内容又分为VR全景和VR虚拟内容,如游戏.娱乐.根据行业划分为VR+购物,VR+教育,VR ...

  5. [刷题]Codeforces 746G - New Roads

    Description There are n cities in Berland, each of them has a unique id - an integer from 1 to n, th ...

  6. 【原创】JQWidgets-TreeGrid 2、初探源码

    已知JQWidgets的TreeGrid组件依赖于jqxcore.js.jqxtreegrid.js,实际上它还依赖于jqxdatatable.js.我们先通过一个例子,来探索本次的话题. 需求: 图 ...

  7. Android studio 断点技巧

    写代码不可避免有Bug,通常情况下除了日志最直接的调试手段就是debug:那么你的调试技术停留在哪一阶段呢?仅仅是下个断点单步执行吗?或者你知道 Evaluate Expression , 知道条件断 ...

  8. C# 关于操作datatable的列名和删除某一列的数据

    1.获取一个数据集表 DataTable dt = selectDEGS(type, words, KUser); 2.删除某一列 dt.Columns.Remove("TaskID&quo ...

  9. 让python bottle框架支持jquery ajax的RESTful风格的PUT和DELETE等请求

    这两天在用python的bottle框架开发后台管理系统,接口约定使用RESTful风格请求,前端使用jquery ajax与接口进行交互,使用POST与GET请求时都正常,而Request Meth ...

  10. 2.Java 加解密技术系列之 MD5

    Java 加解密技术系列之 MD5 序 背景 正文 结束语 序 上一篇文章中,介绍了最基础的编码方式 — — BASE64,也简单的提了一下编码的原理.这篇文章继续加解密的系列,当然也是介绍比较基础的 ...