GNU gawk工具的功能是将指定文件中符合指定模式(pattern)的行按指定的动作(action)进行格式化处理
语法:gawk [options] [program] [file-list]

1、program格式

'pattern {action}'

2、$1,...,$n: 第1列,...,第n列

3、~ (matches operator):包含

$ gawk '$1 ~ /h/' cars

4、关系运算符:==,<=,>=,!=,>,<

#dpkg –get-selections | gawk '$2 != "install" {print $0}'
$ gawk '$5 <= 3000' cars

5、范围运算符:,

$ gawk '/volvo/ , /bmw/' cars

6、BEGIN 模式、END模式

$ gawk 'END {print NR, "cars for sale." }' cars

7、$0: 当前行

8、length函数

$ gawk '{print length, $0}' cars | sort -n

9、NR (record number)变量

$ gawk 'length > 24 {print NR}' cars
$ gawk 'NR == 2 , NR == 4' cars

10、OFS变量:输出字段分隔符(onput field separator)

BEGIN   {OFS = " "}
{
if ($1 ~ /ply/)  $1 = "plymouth"
if ($1 ~ /chev/) $1 = "chevrolet"
print
}

11、FS: 输入字段分隔符(input field separator)

$ cat find_uid
 
BEGIN            {FS = ":"
 saveit = 0}
$3 > saveit     {saveit = $3}
END                {print "Next available UID is " saveit + 1}
 
$ gawk -f find_uid /etc/passwd
Next available UID is 192
 
$ gawk -F: '{print $2}' file;    //-F选项用来在命令行上给FS重新赋值
 
$ gawk -F[: ] '{print $2}' file //使用多个分隔符:空格、冒号:和TAB

12、printf函数

BEGIN   {
printf "%-10s %-8s    %2d   %5d     $ %8.2f",
$1, $2, $3, $4, $5
}

13、重定向输出

$ cat redirect_out
 
/chevy/    {print > "chevfile"}
 
/ford/     {print > "fordfile"}
 
END        {print "done."}
 
$ gawk -f redirect_out cars

14、if...else控制结构

$ cat price_range
 
{
if ($5 <= 5000) $5 = "inexpensive"
else if  (5000 < $5 && $5 < 10000)  $5 = "please ask"
else if  (10000 <= $5)  $5 = "expensive"
printf "%-10s %-8s    %2d    %5d    %-12s",$1, $2, $3, $4, $5
}

15、getline

读取一行,然后gawk的指针指向下一行(NR递增)。如果不带变量:行指针立即变化,NR递增,$0-$n变化;如果带变量: 行指针在{}内不变化,NR递增,$0-$n不变化
 
$ cat g4
{
print NR, "$0:", $0
getline aa
print NR, "aa:", aa
}
 
$ gawk -f g4 < alpha
 
1 $0: aaaaaaaaa
 
2 aa: bbbbbbbbb
 
3 $0: ccccccccc
 
4 aa: ddddddddd

16、其它

gawk 的|&相当于bash的管道 |
gawk能够从网络上获取文件的信息
gawk中的变量赋值后,引用变量不用$,直接引用,不同于bash。
 

=-=-=-=-=
Powered by Blogilo

gawk的用法的更多相关文章

  1. gawk(awk)的用法案例

    gawk(awk)的用法案例 本文首先简单介绍一个gawk和awk的区别,然后是一点基本使用流程,最后是自己做的一个分析数据文件的脚本代码,供大家参考.另外想了解基本流程的入门知识的可以下载附件pdf ...

  2. awk 用法(使用入门)

    转自:http://www.cnblogs.com/emanlee/p/3327576.html awk 用法:awk ' pattern {action} '  变量名    含义 ARGC   命 ...

  3. awk用法

    目前虽然有很多工具可以代替awk,但是呢我还是认为awk还是非常重要,比如有时候load数据到hive,mysql发现数据有点问题,这样可以先对比文件和库中数据是否一致,这样awk就发挥用处了,还有从 ...

  4. 测试技能积木-AWK的简要用法

    做测试工作,经常要分析日志,有的时候活儿还很脏很累,比如抽取符合某些pattern的行,重新格式化等等.有的时候,我们需要也创造一些测试用数据文件.基于上述两种原因,在Unix Like 系统上,一些 ...

  5. Linux Shell 示例精解(第七章 gawk编程)转载

    第七章 gawk功能:gawk编程 7.1.1 数字和字符串常量     初始化和类型强制  在awk中,变量不需要定义就可以直接使用,使用一个变量就是对变量的定义.变量的类型可以试数字.字符串,或者 ...

  6. AWK用法入门详解

    简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再 ...

  7. awk简单用法

    awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各 ...

  8. 《Linux命令行与shell脚本编程大全》第十九章 初识sed和gawk

    这两个工具能够极大简化需要进行的数据处理任务. 19.1 文本处理 能轻松实现自动格式化.插入.修改或删除文本元素的简单命令行编辑. sed和gawk就具备上述功能 19.1.1 sed编辑器 被称为 ...

  9. 《Linux命令行与shell脚本编程大全》第二十二章 gawk进阶

    gawk是一门功能丰富的编程语言,你可以通过它所提供的各种特性来编写好几程序处理数据. 22.1 使用变量 gawk编程语言支持两种不同类型的变量: 内建变量和自定义变量 22.1.1 内建变量 ga ...

随机推荐

  1. 磁盘IO:缓存IO与直接IO

    文件系统IO分为DirectIO和BufferIO,其中BufferIO也叫Normal IO. 1. 缓存IO 缓存I/O又被称作标准I/O,大多数文件系统的默认I/O操作都是缓存I/O.在Linu ...

  2. [Git]01 如何安装和配置

     简单地说,Git 究竟是怎样的一个系统呢? 请注意,接下来的内容非常重要,若是理解了 Git 的思想和基本工作原理,用起来就会知其所以然,游刃有余.在开始学习 Git 的时候,请不要尝试把各种概 ...

  3. java中构造方法和this,static关键字

    构造方法: 构造方法是一种特殊的方法,用于创建该类的对象,对对象的数据进行初始化 格式如下: [修饰符] 类名(形参列表){ 方法体 } 特点 A:方法名和类名相同  B:没有返回值类型,连void都 ...

  4. js,jQuery和DOM操作的总结(一)

    废话不说,直接上图 一 js的基本操作 (1)js 的六种数据类型 var n4;//六种数据类型用typeof来确定类型,Null类型的用typeof是不行的,这个是特殊 alert(typeof ...

  5. vlan内部与外部某终端之间的通信

    实现虚拟局域网外部终端与内部终端之间的通信,即实现pc3与pc1和pc4之间的通信. 把交换机上的默认VLAN1改成VLAN2(红色字体命令). 各vlan内部终端的通信,是通过vlan ID来实现的 ...

  6. 基于ZKWeb + Angular 4.0的开源管理后台Demo

    这是一套基于ZKWeb网页框架和Angular 4.0编写的开源管理后台Demo,实现了前后端分离和模块化开发, 地址是: https://github.com/zkweb-framework/ZKW ...

  7. Java7中的ForkJoin并发框架初探(上)——需求背景和设计原理

    原文:发表于 2013 年 8 月 26 日 由 三石 0. 处理器发展和需求背景 回想一下并发开发的初衷,其实可以说是有两点,或者说可以从两个方面看. 对于单核的处理器来说,在进行IO操作等比较费时 ...

  8. 用 Vue 全家桶二次开发 V2EX 社区

    一.开发背景 为了全面的熟悉Vue+Vue-router+Vuex+axios技术栈,结合V2EX的开放API开发了这个简洁版的V2EX. 在线预览 (为了实现跨域,直接npm run dev部署的, ...

  9. 编写第一个python selenium程序(二)

    上节介绍了如何搭建selenium 系统环境,那么本节来讲一下如何开始编写第一个自动化测试脚本. Selenium2.x 将浏览器原生的API封装成WebDriver API,可以直接操作浏览器页面里 ...

  10. 你真的了解WebSocket吗?

    WebSocket协议是基于TCP的一种新的协议.WebSocket最初在HTML5规范中被引用为TCP连接,作为基于TCP的套接字API的占位符.它实现了浏览器与服务器全双工(full-duplex ...