gawk - pattern scanning and processing language

基本用法:gawk [options] 'program' FILE ...

program:PATTERN{ACTION STATEMENTS}

语句之间用分号分隔

    print,printf
选项:
-F:指明输入时用到的字段分隔符;
-v var=value:自定义变量 1、print
print item1,item2,...
要点:
1.逗号分隔符;
2.输出的各item可以字符串,也可以是数值;当前记录的字段、变量或awk的表达式;
3.如省略item,相当于print $0;
2、变量
内建变量:
FS:input field seperator,默认为空白字符;
OFS:output field seperator,默认为空白字符;
RS:input record seperator,输入的换行符
ORS:output record seperator,输出时的换行符;
NF:number of field,每一行的字段数量
NR:number of record,行数
FNR:file number of record,行文件分别计数;
FILENAME:当前文件名;
ARGC:命令行参数的个数;
ARGV:数组,保存的是命令行所给定的各参数;
自定义变量:
1.-v var=value
2.在program中直接定义
3、printf命令
格式化输出:printf FORMAT,item1,item2
(1) FORMAT必须给出
(2) 不会自动换行,需要显式给出换行控制符,\n
(3) FORMAT中需要分别为后面的每个item指定一个格式化符号;
格式符:
%c:显示字符的ASCII码
%d,%i:显示为十进制整数
%e,%E:显示为科技计数法
%f:显示为浮点数
%g,%G:以科学计数法或浮点形式显示数值
%s:显示字符串
%u:无符号整数
%%:显示%自身
修饰符:
#[.#]:第一个数字控制显示的宽度;第二个#表示小数点后的精度
%3.1f
-:左对齐
+:显示数值的符号
4、操作符
算术运行:
x+y,x-y,x*y,x/y,x^y,x%y
-x
+x:把字符串转换为数值
字符串操作符:没有符号的操作符,字符串连接
赋值操作符:
=,+=,-=,*=,/=,%=,^=
比较操作符:
>,>=,<,<=,!=,==
模式匹配:
~:是否匹配
!~:是否不匹配
逻辑操作符:
&&
||
!
函数调用:
function_name(argu1,argu2...)
条件表达式:
selector?if-true-expression:if-false-expression
5、PATTERN
(1) empty:空模式,匹配每一行;
(2) /regular expression/:仅处理能够被此处的模式匹配到的行;
(3) !/regular expression/:对模式取反;
(4) relational expression:关系表达式,结果有“真”有“假”,结果为“真”才被处理;
真:结果为非0值,非空字符串
(5) line ranges:行范围
startline,endline,不支持
/pat1/,/pat2/
(NR>=2&&NR<=10)
(6) BEGIN/END模式
BEGIN{}:仅在开始处理文件中的文本之前执行一次;
END{}:仅在文本处理完成之后命令结束之前执行一次;
6、常用action
(1) Expressions;
(2) Control statements:if,while等;
(3) Compound statements:组合语句;
(4) input statements
(5) output statements
7、控制语句
if(condition) {statements}
if(condition) {statements} else {statements}
while(condition) {statements}
do {statements} while(condition)
for (expr1;expr2;expr3) {statements}
break
continue
delete array[index]
delete array
exit
{statements} 7.1 if-else
语法:if(condition) statement [else statement]
# awk -F: '{if($3>=1000) {printf "Common user:%20s\n" $1} else { printf "root or Sysuser:%20s\n",$1}}' /etc/passwd
#awk -F: '{if($NF=="/bin/bash") print $1}' /etc/passwd
#awk '{if(NF>=5) print $0}' /etc/fstab
#df -h | awk -F[%] '/\/dev/{print $1}' | awk '{if($NF>=80) print $NF}'
使用场景:对awk取得的整行或某个字段做判断
7.2 while 循环
语法 while (condition) statement
条件“真”,进入循环:条件“假”,退出循环 使用场景:对一行内多个字段进行类似处理时使用;
#awk '/^[[:space:]]*linux16/ {i=1;while(i<=NF) {print $i,length($i);i++}}' /etc/grub2.cfg
7.3 do-while 循环
语法:do statement while (condition)
意义:至少执行一次循环体
7.4 for 循环
语法:for (expr1;expr2;expr3) statement
for(variableassignment;condition;iteration process) {for-body}
# awk '/^[[:space:]]*linux16/ { for (i=1;i<=NF;i++) {print $i,length($i)}}' /etc/grub2.cfg
特殊用法:
能遍历数组中的元素:
语法 for (var in array) {for-body} 7.5 switch 语句
语法:switch(expression){case VALUE1 or /REGEXP:statment;case VALUE2 or /REGEXP2/: statement;...;default:statement}
7.6 break 和 continue
break [n]
continue
7.7 next
提前结束本行的处理,直接进入下一行
# awk -F: '{if ($3%2!=0) next;print $1,$3}' /etc/passwd
8、array
关联数组:array[index-expression]
index-expression:
(1) 可使用任意字符串;
(2) 如果某数组元素事先不存在,在引用时,awk会自动创建此元素并将其值初始化为空;
要判断数组中是否存在某元素,要使用"index in array"格式进行
weekdays[mon]="Monday"
# awk 'BEGIN {weekdays["mon"]="Monday";weekdays["tue"]="Tuesday" ;print weekdays["mon"]}' 若要遍历数组中每个元素,使用for循环
# awk 'BEGIN {weekdays["mon"]="Monday";weekdays["tue"]="Tuesday" ;for (i in weekdays )print weekdays[i]}'
# netstat -tan | awk '/^tcp\>/ {state[$NF]++} END { for (i in state) {print i, state[i]}}' #cat /etc/fstab | awk '/^\/dev/ {fstype[$3]++} END {for (i in fstype) print i ,fstype[i]}'
# awk '{for(i=1;i<=NF;i++) {count[$i]++} } END {for (i in count) print i,count[i]}' /etc/services
9、函数
9.1 内置函数
数值处理:
rand():返回0和1之间的一个小数
字符串处理
length([s]):返回指定字符串长度;
sub(r,s,[t]):以r表示的模式来查找t所表示的字符串中的匹配的内容,将将其第一次出现替换为s的内容
gsub(r,s[t]):全部替换
split(s,a[,r]):以r为分隔符切割字符s,并将切割后的结果保存到a所表示的数组中;
netstat -tan | awk '/^tcp\>/ {split($5,ip,":"); count[ip[1]]++} END {for (i in count) {print i,count[i]}}'
9.2 自定义函数

awk使用教程的更多相关文章

  1. AWK 简明教程

    AWK 简明教程 转自:http://coolshell.cn/articles/9070.html 有一些网友看了前两天的<Linux下应该知道的技巧>希望我能教教他们用awk和sed, ...

  2. 【转】AWK 简明教程

    本文转自:http://coolshell.cn/articles/9070.html 有一些网友看了前两天的<Linux下应该知道的技巧>希望我能教教他们用awk和sed,所以,出现了这 ...

  3. awk简明教程

    我在这里的教程并不想面面俱到,全是示例,基本无废话. 我只想达到两个目的: 1)你可以在乘坐公交地铁上下班,或是在坐马桶拉大便时读完(保证是一泡大便的工夫). 2)我只想让这篇博文像一个火辣的脱衣舞女 ...

  4. awk 入门教程

    作者: 阮一峰 日期: 2018年11月 7日   awk是处理文本文件的一个应用程序,几乎所有 Linux 系统都自带这个程序. 它依次处理文件的每一行,并读取里面的每一个字段.对于日志.CSV 那 ...

  5. awk初级教程

    参考:sed & awk 概述 sed & awk指令组成 与sed区别 尽管awk指令与sed指令的结构相同,都由模式和过程两部分组成,但过程本身有很大不同. awk看上去不像编辑器 ...

  6. awk与sed简明教程

    看到大牛写的关于awk和sed的简明教程,写得很好,为了尊重作者,就不全文转载了,这里标记下链接,方便以后查阅. awk简明教程:http://coolshell.cn/articles/9070.h ...

  7. 转载一篇棒棒的AWK教程

    处理文件经常要用到awk,老是找同事帮忙,次数多了难免被吐槽orz,其实之前也有找过awk的教程,表示一直看不太懂 最近翻到了这篇教程,表示笔者真的太棒了,反正我是看一遍就懂了哈哈 剩下的只是熟悉度的 ...

  8. [shell基础]——awk命令

    关于awk awk是一个强大的文本分析工具,相对于grep的查找.sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大. 简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开 ...

  9. 正则、grep、sed、awk

    每次用到正则都要蛋疼一下,索性总结一下在这里. 正则 正則表達式主要分为基础正则和扩展正则.注意,正则和一般命令行输入的命令的通配符不同.正则仅仅使用于支持这样的表示法的工具,如:vi,grep,se ...

随机推荐

  1. CPU、OpenGL/DirectorX、显卡驱动和GPU之间的关系

  2. windows下开启端口映射配置办法

    #1.添加一个端口映射 netsh interface portproxy add v4tov4 listenaddress=大网IP listenport=端口  connectaddress=要映 ...

  3. 关于ActionBar 左侧添加完返回后 点击无效的问题

    ActionBar actionBar =getSupportActionBar(); if(actionBar!=null){ actionBar.setHomeAsUpIndicator(R.mi ...

  4. 如何查找php-fpm监听的端口

    1. 找到php的安装位置.如: /usr/local/php-7.3.3 2. 进入安装目录下的etc/php-fpm.d目录,然后你会看到: 3. 打开www.conf,搜索listen关键字,你 ...

  5. IDEA能运行,但是出现红色下划线的问题报 cannot resolve method

    能编译通过并运行说明SDK导入正确,但是为啥我们点击每一个Java文件会出现好多红色的下划线 ,并提示idea cant resolve symbol.原因就是可能没有清除原来的历史缓存,导致一些错误 ...

  6. 『TensorFlow』SSD源码学习_其八:网络训练

    Fork版本项目地址:SSD 作者使用了分布式训练的写法,这使得训练部分代码异常臃肿,我给出了部分注释.我对于多机分布式并不很熟,而且不是重点,所以不过多介绍,简单的给出一点训练中作者的优化手段,包含 ...

  7. Python图片缩放

    from PIL import Image def size(jpg,now_size): im = Image.open(jpg) width, height = im.size if width& ...

  8. win 安装plsql的步骤

    1.下载oracle和plsql地址:http://pan.baidu.com/s/1bTlcom,http://pan.baidu.com/s/1c2BMsZe 2.首先安装plsql 这个比较简单 ...

  9. PAT 1013 Battle Over Cities

    1013 Battle Over Cities (25 分)   It is vitally important to have all the cities connected by highway ...

  10. 【转】MVC form提交实体接收参数时空字符串值变成null

    问题:entity.BZ的值是null,Request.Form["BZ"]的值是空字符串 目标:让entity.BZ的值是空字符串. 解决方法:在实体的BZ属性上加上 [Disp ...