gawk进阶
一、使用变量
gawk支持两种不同类型的变量:
- 内建变量
- 自定义变量
1.1 内建变量
①字段和记录分隔符变量
FIELDWIDTHS:有空格分割的一列数字,定义了每个数据字段确切宽度
- FS:输入字段分隔符
- RS:输入记录分隔符
- OFS:输出字段分隔符
- ORS:输出记录分隔符
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{FS=","; OFS="-"} {print $1,$2,$3}' data1
data11-data12-data13
data21-data22-data23
data31-data32-data33
chen@ubuntu:~/shell/ch22$ cat data1
data11,data12,data13,data14,data15
data21,data22,data23,data24,data25
data31,data32,data33,data34,data35
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{FS=","; OFS="--"} {print $1,$2,$3}' data1
data11--data12--data13
data21--data22--data23
data31--data32--data33
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{FS=","; OFS="<-->"} {print $1,$2,$3}' data1
data11<-->data12<-->data13
data21<-->data22<-->data23
data31<-->data32<-->data33
cat data1b
1005.3247596.
-2.349194.
05180.1298100.
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{FIELDWIDTHS="3 5 2 5"}{print $1,$2,$3,$4}' data1b
5.324 96.37
-2.34 94.00
80.12 100.1
chen@ubuntu:~/shell/ch22$ cat data2
Riley Mullen
Main Street
Chicago, IL
()-
Frank Williams
Oak Street
Indianapolis, IN
()-
Haley Snell
Elm Street
Detroit, MI
()-
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{FS="\n"; RS=""}{print $1,$4}' data2
Riley Mullen ()-
Frank Williams ()-
Haley Snell ()-
#把换行符变成字段分隔符,把空行当做一个字段分隔符
字段分隔符例子
②数据变量
- ARGC:当前命令行参数个数
- ARGIND:当前文件在ARGV中的位置
- ARGV:包含命令行参数的数组
- CONVFMT:数字的转换格式
- ENVIRON:当前shell环境变量及其值组成的关联数组
- ERRNO:当读取或闭输入文件发生错误时的系统错误号
- FILENAME:用作gawk输入数据的数据文件的文件名
- FNR:当前数据文件中的数据行数
- IGNORECASE:设成非零值时,忽略gawk命令中出现的字符串的字符大小写
- NF:数据文件中的字段总数
- NR:已处理的输入记录数
- OFMT:数字的输出格式,默认值为%.6g
- RLENGTH:由match函数所匹配的子字符串的长度
- RSTART:由match函数所匹配的子字符串的起始位置
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{print ARGC,ARGV[1]}' data1
data1
chen@ubuntu:~/shell/ch22$ cat data1
data11,data12,data13,data14,data15
data21,data22,data23,data24,data25
data31,data32,data33,data34,data35
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{print ARGC,ARGV[0]}' data1
gawk
chen@ubuntu:~/shell/ch22$ gawk '
> BEGIN{
> print ENVIRON["HOME"]
> print ENVIRON["PATH"]
> }'
/home/chen
/home/chen/bin:/home/chen/.local/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{FS=":"; OFS=":"} {print $1,$NF}' /etc/passwd
root:/bin/bash
daemon:/usr/sbin/nologin
bin:/usr/sbin/nologin
sys:/usr/sbin/nologin
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{FS=","}{print $1,"FNR="FNR}' data1 data1
data11 FNR=
data21 FNR=
data31 FNR=
data11 FNR=
data21 FNR=
data31 FNR=
chen@ubuntu:~/shell/ch22$ cat data1
data11,data12,data13,data14,data15
data21,data22,data23,data24,data25
data31,data32,data33,data34,data35
数据变量例子
1.2 自定义变量
gawk自定义变量名可以是任意数目的字母、数字和下划线。gawk变量名区分大小写。
①在脚本中给变量赋值
chen@ubuntu:~/shell/ch22$ gawk '
> BEGIN{
> testing="This is a test"
> print testing
> }'
This is a test
chen@ubuntu:~/shell/ch22$ gawk '
> BEGIN{
> testing="This is a test"
> print testing
> testing=
> print testing
> }'
This is a test chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{x=4; x= x * 2 + 3; print x}'
变量赋值例子
②在命令行上给变量赋值
chen@ubuntu:~/shell/ch22$ cat script1
BEGIN{FS=","}
{print $n}
chen@ubuntu:~/shell/ch22$ gawk -f script1 n= data1
data12
data22
data32
chen@ubuntu:~/shell/ch22$ gawk -f script1 n= data1
data13
data23
data33 chen@ubuntu:~/shell/ch22$ gawk -f script2 n= data1
The starting value is
data13
data23
data33
chen@ubuntu:~/shell/ch22$ cat script2
BEGIN{print "The starting value is",n; FS=","}
{print $n} chen@ubuntu:~/shell/ch22$ gawk -v n= -f script2 data1
The starting value is
data13
data23
data33
命令行上给变量赋值例子
二、处理数组
2.1 定义数组变量
数组变量赋值的格式如下:
var[index] = element
其中var是变量,index是关联数组的索引值,element是数据元素
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{
> capital["Illinois"] = "Springfield"
> print capital["Illinois"]
> }'
Springfield
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{
> var[] =
> var[] =
> total = var[] + var[]
> print total
> }'
定义数组变量
2.2 遍历数组变量
gawk中遍历数组,用一种for的特殊形式
for ( var in array )
{
statements
}
使用例子:
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{
var["a"] =
var["g"] =
var["m"] =
var["u"] =
for ( test in var)
{
print "Index:",test," - Value:",var[test]
}
}'
Index: u - Value:
Index: m - Value:
Index: a - Value:
Index: g - Value:
数组遍历
2.3 删除数组变量
从关联数组中删除数组索引要用一个特殊的命令。
delete array[index]
删除命令会从数组中删除关联索引值和相关的数据元素值
chen@ubuntu:~/shell/ch22$ gawk 'BEGIN{
> var["a"] =
> var["g"] =
> for (test in var)
> {
> print "Index:",test," - Value:",var[test]
> }
> delete var["g"]
> print "---"
> for (test in var)
> print "Index:",test," - Value:",var[test]
> }'
Index: a - Value:
Index: g - Value:
---
Index: a - Value:
删除例子
三、使用模式
本节将会演示如何在gawk脚本中用匹配模式来限定程序脚本作用在哪些记录上。
3.1 正则表达式
在使用正则表达式时,正则表达式必须出现在它要控制的程序脚本的左花括号前。
myfly2@ubuntu:~$ cat data1
data11,data12,data13,data14,data15
data21,data22,data23,data24,data25
data31,data32,data33,data34,data35
myfly2@ubuntu:~$ awk 'BEGIN{FS=","} /11/{print $1}' data1
data11
myfly2@ubuntu:~$ awk 'BEGIN{FS=","} /,d/{print $1}' data1
data11
data21
data31
匹配符例子
3.2 匹配操作符
匹配操作符:允许将正则表达式限定在记录中的特定数据字段。
匹配操作符是波浪线(~)。可以指定匹配操作符、数据字段变量以及要匹配的正则表达式。
$1 ~ /^data/
$1:代表记录中的第一个数据字段。这个表达式会过滤出第一个字段以文本data开头的所有记录。
myfly2@ubuntu:~$ awk 'BEGIN{FS=","} $2 ~ /^data2/{print $0}' data1
data21,data22,data23,data24,data25
myfly2@ubuntu:~$ awk -F: '$1 ~ /myfly/{print $1,$NF}' /etc/passwd
myfly2 /bin/bash
匹配操作符例子
$1 !~ /expression/
myfly2@ubuntu:~$ awk -F: '$1 !~ /myfly2/{print $1,$NF}' /etc/passwd
root /bin/bash
daemon /usr/sbin/nologin
bin /usr/sbin/nologin
sys /usr/sbin/nologin
sync /bin/sync
games /usr/sbin/nologin
man /usr/sbin/nologin
lp /usr/sbin/nologin
!~例子
3.3 数学表达式
除了正则表达式,也可以在匹配模式中用数学表达式。 常用的表达式:
- x == y:值x等于y
- x <= y:值x小于等于y
- x < y:值x小于y
- x >= y:值x大于等于y
- x > y:值x大于y
myfly2@ubuntu:~$ awk -F: '$4 == 0{print $1}' /etc/passwd
root
myfly2@ubuntu:~$ awk -F, '$1 == "data"{print $1}' data1
myfly2@ubuntu:~$ cat data1
data11,data12,data13,data14,data15
data21,data22,data23,data24,data25
data31,data32,data33,data34,data35
myfly2@ubuntu:~$ awk -F, '$1 == "data11"{print $1}' data1
data11
#与正则表达式不同,数学表达式必须完全匹配
例子
四、结构化命令
4.1 if语句
gawk支持标准的if-then-else格式的if语句。
格式: if (condition)
statement1
也可以这样:if (condition) statement1
awk '{if ($1 > 20) print $1}' data4
myfly2@ubuntu:~/shell/ch22$ awk '{
> if ($ > )
> {
> x = $ *
> print x
> }
> }' data4
if-then例子
4.2 while语句
基本循环的格式:
while (condition)
{
statement1
}
myfly2@ubuntu:~/shell/ch22$ awk '{
total =
i =
while (i<)
{
total += $i
i++
}
avg = total /
print "Average:",avg
}' data5
Average: 128.333
Average: 137.667
Average: 176.667
myfly2@ubuntu:~/shell/ch22$ awk '{
> total =
> i =
> while (i<)
> {
> total += $i
> if(i == )
> break
> i++
> }
> avg = total /
> print "The average of the first two data elements is:",avg
> }' data5
The average of the first two data elements is:
The average of the first two data elements is: 136.5
The average of the first two data elements is: 157.5
while例子
4.3 do-while语句
格式:
do
{
statements
}
myfly2@ubuntu:~/shell/ch22$ awk '{
> total =
> i =
> do
> {
> total += $i
> i++
> }
> while (total < )
> print total }' data5
do while例子
4.4 for语句
格式:for( variable assignment; condition; iteration process)
myfly2@ubuntu:~/shell/ch22$ awk '{
> total =
> for(i=;i<;i++)
> {
> total += $i
> }
> avg = total /
> print "Average:",avg
> }' data5
Average: 128.333
Average: 137.667
Average: 176.667
for例子
五、格式化打印
六、内建函数
6.1 数学函数
6.2 字符串函数
6.3 时间函数
七、自定义函数
7.1 定义函数
7.2 使用自定义函数
7.3 创建函数库
八、实例
gawk进阶的更多相关文章
- 《Linux命令行与shell脚本编程大全》第二十二章 gawk进阶
gawk是一门功能丰富的编程语言,你可以通过它所提供的各种特性来编写好几程序处理数据. 22.1 使用变量 gawk编程语言支持两种不同类型的变量: 内建变量和自定义变量 22.1.1 内建变量 ga ...
- Shell编程—gawk进阶
1使用变量 awk编程语言支持两种不同类型的变量: 内建变量 自定义变量 1.1内建变量 1. 字段和记录分隔符变量 数据字段变量允许你使用美元符号($)和字段在该记录中的位置值来引用记录对应的字段. ...
- 两个有用的shell工具总结
shell工具之一:sed sed基础 sed编辑器被称作流编辑器,与常见的交互式文本编辑器刚好相反.文本编辑器可以通过键盘来交互式地插入.删除.替换文本中的数据:而流编辑器是基于一组预先的规则来编辑 ...
- 《Linux命令行与shell脚本编程大全 第3版》
第一部分 Linux 命令行 第1章 初识Linux she1.1 什么是Linux 21.1.1 深入探究Linux 内核 31.1.2 GNU 工具 61.1.3 Linux 桌面环境 81 ...
- Linux三剑客之awk精讲(基础与进阶)
第1章 awk基础入门 要弄懂awk程序,必须熟悉了解这个工具的规则.本实战笔记的目的是通过实际案例或面试题带同学们熟练掌握awk在企业中的用法,而不是awk程序的帮助手册. 1.1 awk简介 一种 ...
- nodejs进阶(6)—连接MySQL数据库
1. 建库连库 连接MySQL数据库需要安装支持 npm install mysql 我们需要提前安装按mysql sever端 建一个数据库mydb1 mysql> CREATE DATABA ...
- nodejs进阶(4)—读取图片到页面
我们先实现从指定路径读取图片然后输出到页面的功能. 先准备一张图片imgs/dog.jpg. file.js里面继续添加readImg方法,在这里注意读写的时候都需要声明'binary'.(file. ...
- JavaScript进阶之路(一)初学者的开始
一:写在前面的问题和话 一个javascript初学者的进阶之路! 背景:3年后端(ASP.NET)工作经验,javascript水平一般般,前端水平一般般.学习资料:犀牛书. 如有误导,或者错误的地 ...
- nodejs进阶(3)—路由处理
1. url.parse(url)解析 该方法将一个URL字符串转换成对象并返回. url.parse(urlStr, [parseQueryString], [slashesDenoteHost]) ...
随机推荐
- 认识DOM(上)
认识DOM 文档对象模型DOM(Document Object Model)定义访问和处理HTML文档的标准方法.DOM 将HTML文档呈现为带有元素.属性和文本的树结构(节点树). 先来看看下面代码 ...
- Delphi XE2 之 FireMonkey 入门(6) - TLine、TEllipse、TCircle、TPie、TArc、TRectangle、TRoundRect、TCalloutRectangle
它们都是继承自 TShape 类, 共同拥有如下属性: Fill : TBrush; //填充 Stroke : TBrush; //边线( ...
- 阶段1 语言基础+高级_1-3-Java语言高级_1-常用API_1_第1节 Scanner类_3-Scanner的使用步骤
Scanner如何进行键盘输入,引用类型就包含了Scanner,它就是引用类型,所以也有这三个步骤, 导包.创建.使用 先通过api文档找到它.左边输入要查找scanner.双夹scanner右边就会 ...
- vi, Java, Ant, Junit自学报告 - 实训week1
vi, Java, Ant, Junit自学报告 2017软件工程实训 15331023 陈康怡 vi Vi是linux系统的标准文本编辑器,采用指令的方式进行操作,此处仅记录部分常用的指令. vi模 ...
- Linux 下在后台运行进程:nohup,setsid,& 以及 tmux
参考: Linux 技巧:让进程在后台可靠运行的几种方法 ssh 登录了远程服务器时,如果在前台运行耗时较长的任务, 当 ssh 掉线或关闭窗口时会导致命令停止运行. hup 与 nohup 当用户注 ...
- linux上搭建nginx+ftp,实现文件的上传与访问
ftp服务器搭建 1.新建用户ftpuser并指定主目录为/home/ftpuser (注意:这个目录是后面存储和读取文件的目录) <!--创建用户并指定主目录--> useradd -d ...
- 【MM系列】SAP MM模块-委外采购订单 把Warning转换成Error信息提示
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[MM系列]SAP MM模块-委外采购订单 把W ...
- js变量和数据类型
- 应用安全-Web安全-子域名/相关域名
技巧 DNS解析记录 主站获取 单点登录接口 crossdomain.xml IP反查 通过HTTPS证书收集 DNS域传送搜集 联系人信息/邮箱反查域名 x-dns-prefetch-control ...
- Linq查询语法(2)
转:http://www.cnblogs.com/knowledgesea/p/3897665.html 1.简单linq查询 var ss = from r in db.Am_recProSchem ...