linux中awk的使用

在linux中awk绝对是核心工具，特别是在查找搜索这一领域，和掌握sed命令一样重要

下面为awk的一些基本知识，基于这些知识，可以让你随意操控一个文件：

在awk中：()括号为条件块，{}为执行的命令块

一般情况下awk有这几部分组成：

awk 'BEGIN{}(){}END{}' file

BEGIN为初始化操作，中间为对file文件中每一行的处理，END块中为最后的输出

当然，awk不是必须这3个都有，也不是缺少谁就不行的。可以只有BEGIN，也可以只有END

print命令
打印文件内容
awk '{print}' datafile

-f参数
执行awk脚本，如脚本为hello.awk
awk -f hello.awk datafile

$number
表示记录的字段，其中$0表示整个串

FS
表示字段分隔符，如下以逗号作为分隔符
awk 'BEGIN{FS=","}{print}' datafile
当写脚本文件时，一般用FS

-F参数
同FS作用一样，设置分隔符，如
awk -F "," '{print $1}' datafile

NF
表示当前记录行中的字段数量

NR
表示当前记录的编号，即行号

FNR
当前浏览文件的记录数

FS="\t+"
表示以一个或多个制表符作为分隔符

OFS
字符分隔符，俩个字段间插入分隔符

RS
记录分隔符，即一行的分隔符

ORS
输出记录分隔符，俩个记录间(行)插入

OFMT 数的输出格式

CONVFMT 数值的内部转换格式

布尔表达式
awk -F "," '$1=="Hello" {print $1}' datafile
只有第一个参数值为Hello时，才打印第二个

length(string1)
返回string1长度

index(string1,string2)
返回string2在string1中的位置，没有返回0

tolower(string1)/toupper(string1)
返回大小写

substr(string1,5,3)
从string1的第5位置开始截取长度为3的字段

match(string1,/you/),RSTART,RLENGTH
match匹配的是一个正则表达式
RSTART返回第一个匹配的位置
RLENGTH指定他占据的字符跨度，没有为-1

gsub/sub(/My/,"You",string1)
gsub全局替换，sub只替换第一个
如上为在string1中查找My并替换为You

split(string1,strarray,",")
print strarray[1],strarray[numelements]
把string1以逗号分割，并传入到strarray组中
从1开始编号

删除重复行(必须先排序)
sort datafile|awk '{if($0!=line)print;line=$0}'

FILENAME
awk中特殊存在，用于表示文件
awk 'END{print FILENAME}' datafile
打印file名字
若有多个输入文件则可以用于判断，如:
awk 'if(FILENAME=="file1"){arr[$3]=$1}else{($1 in arr){print arr[$1]"|"$2}} file1 file2
注意:awk先处理前面文件再处理后面文件

ARGIND
当前被处理参数标记

ARGC
命令行参数个数

ARGV
命令行参数排列

ENVIRON
支持队列中环境变量的使用

next
下一个命令不执行
awk '(NR%2=1){next}{print}' f1
awk 'NR==FNR{a[$0]=$0;next}a[$0]{print a[$0],$0}

nextfile
中断当前文件处理，进入下个文件处理:
awk '{print FILENAME;nextfile} f1 f2
打印俩个文件名，多用于查找文件

exit
停止awk，并执行END语句块后退出

定义函数:
awk '{print "sum=",sqrtsum($1,$2)}function sqrtsum(x,y){return x*x+y*y}' file
awk '{print "sum=",$1*$1+$2*$2}

-v
加载环境或shell中的参数
awk-F \| -v ORAHOME=${ORA_HOME} '{print $1"|"ORAHOME>"datafile1"} datafile
或者如下:
awk-F \| '{print $1"|"ORAHOME>"datafile1"} ORAHOME=${ORA_HOME} datafile

注：若在BEGIN中使用环境变量，则必须使用-v模式

getline
获取文件的行内容，一般放在BEGIN中
一个getline获取一行，也可以保存到变量
awk 'BEGIN{getline var1}END{print var1}' file

打印5行之后的行:
awk 'NR>5' file
打印2到6行:
awk 'NR==2,NR==6' file
打印前5行:
awk '!(NR>5)' file
awk 'NR<6' file
打印5倍数的行:
awk '(NR%5==0){print}' file
awk '!(NR%5){print}' file

awk中相关操作符使用

~操作符
俩边匹配符，可模糊比较，如:
awk 'BEGIN{FS="|"}($2~/..My./){print}' file

表示在第二个字段中包含5个字符，其中第3、4个字符为My的行

比较运算符
==俩边相等
>
>=
<
<=
!=俩边不等
~ 匹配正则表达式
!~ 不匹配正则表达式
‖逻辑或
&& 逻辑与

算术运算符
+      加法
-       减法
*      乘法
/      除法
^     指数算法
%    模算法
--     自-1(前后自减)
++   自+1(前后自加)
+=    自加算法
-=      自减算法
*=      自乘算法
/=      自除算法
^=     自指数算法
%=    自模算法

统计文本中空行数量
awk 'BEGIN{x=0}/^$/{x+=1}END{print x}' datafile
/^$/表示空行

正则表达式:
\      转义符
^      行首符
$      行尾符
.        匹配一个字符
[ ]      匹配其中一个字符
|        或操作
( )     判断语句
*       匹配0个或多个前面的字符
+      匹配前面一个或多个字符
?      匹配模式出现频率

if语句
if($1=="foo"){
    print "foo"
}else if($1=="bar"){
    print "bar"
}else{
    print "other"
}

do..while语句
{
count=6
do{
     print count
     count--
    }while(count！=1)
}

while语句
{
while(x<NF){
     print $x
     x++
   }
}

for语句
for(x=1;x<=5;x++){
print x
}

linux中awk的使用的更多相关文章

Linux中awk后面的RS, ORS, FS, OFS 用法
Linux中awk后面的RS, ORS, FS, OFS 含义一.RS 与 ORS 差在哪我们经常会说,awk是基于行列操作文本的,但如何定义“行”呢?这就是RS的作用. 默认情况下,RS的 ...
[转帖]Linux中awk工具的使用
Linux中awk工具的使用 2018年10月09日 17:26:20 谢公子阅读数 2170更多分类专栏: linux系统安全版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权 ...
linux中awk命令(最全面秒懂）
目录一:linux中awk命令 1.awk命令简介 2.awk作用 3.awk的语法格式 4.解析awk使用方法 5.参数 6.awk的生命周期二:awk中的预定义变量三:awk运行处理规则的执 ...
linux中awk命令详解(最全面秒懂）
一:linux中awk命令 1.awk命令简介 AWK 是一种处理文本文件的语言,是一个强大的文本分析工具. 之所以叫 AWK 是因为其取了三位创始人 Alfred Aho,Peter Weinber ...
linux中awk工具的使用（转）
add by zhj: awk很强大,它是一个简单的编程语言,国外有本专门的书介绍它的用法.<effective awk programming>,它支持整型,字符串型,数组,变量在使用前 ...
linux中awk 详解
一.awk简介 awk是一个非常好用的数据处理工具,相对于sed常常作用于一整个行的处理,awk则比较倾向于一行当中分成数个[字段]处理,因此,awk相当适合处理小型的数据数据处理.awk是一种报表生 ...
linux中awk命令学习
awk是一个强大的文本分析工具,awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理. 通常获取某一行时,我们会使用 “grep 关键字“进行查找,但在读取某一列时, ...
Linux中awk的用法
一.awk简介 awk是一种编程语言,用于在linux/unix下对文本和数据进行处理.数据可以来自标准输入.一个或多个文件,或其它命令的输出.它支持用户自定义函数和动态正则表达式等先进功能,是lin ...
linux中awk工具的使用(转载)
awk是一个非常好用的数据处理工具.相较于sed常常一整行处理,awk则比较倾向于一行当中分成数个“字段”处理,awk处理方式如下: $ awk '条件类型1{动作1} 条件类型2{动作2} ...' ...

随机推荐

openvpn显示连接成功但是无法进行git操作
使用openvpn连接公司内网以进行git操作.以管理员身份运行openvpn gui,一段时间后提示连接成功,右下角图标变成绿色,但是进行git操作,每次都发生失败,提示连接不上.右键点击openv ...
判断JS的数据类型
typeof.instanceof. constructor. prototype方法比较 (摘自如何判断JS中的数据类型) 1. 使用typeof操作符. 对一个值使用 typeof 操作符可能返回 ...
20175126《Java程序设计》第一周学习总结
# 学号 20175126 <Java程序设计>第一周学习总结 ## 教材学习内容总结 - 1.安装了WINDOS系统的JDK,并学会了利用JDK编写并编译JAVA程序的基本方法. ...
ES6 Generator 异步编程解决方案&&&promise
Generator: 是比promise更高级的解决方案 next yield function 后加* 状态机 generator语法糖长轮询接口常查询 ================= ...
Django contenttypes 应用
Django contenttypes 应用什么是Django ContentTypes? Django ContentTypes是由Django框架提供的一个核心功能,它对当前项目中所有基于Dja ...
[Algorithm]Algorithm章1 排序算法
1.冒泡排序-相邻交换 (1)算法描述冒泡排序是一种简单的排序算法.它重复地走访过要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来.走访数列的工作是重复地进行直到没有再需要交换,也 ...
[C#]SmtpClient发送邮件
这几天开发的从数据库抓起数据处理完已邮件发出来,只实现的To的个人的发送,To的群组,CC的个人和群组,BCC的个人和群组都没有成功.试了好久,感觉是Exchange服务器配置的问题,但又无法访问Ex ...
学习:java集合
java是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由Sun Microsystems公司于1995年5月推出的Java程序设计语言和Java平台(即JavaEE, JavaME, Jav ...
redis 集群模式安装
概念 Redis集群提供一种方式自动将数据分布在多个Redis节点上. 每个Redis集群中的节点都需要打开两个TCP连接.一个连接用于正常的给Client提供服务,比如6379,还有一个额外的端口( ...
springmvc接收数组方式总结
1.接受正常的数组如param1=aaa&param1=bbb&param1=3 对于这种,在实体参数中,使用String param1[] 这种参数既可以获取数组的值 2.接受数组 ...

linux中awk的使用

linux中awk的使用的更多相关文章

随机推荐

热门专题