AWK用法整理

printf "1:2::3:::4::::5" | awk -F '[:]+' '{print $4}'

[:]+ 表示以1个或多个 :（冒号）作为分隔符

ip addr |awk -F '[ ]+' 'NR==8 {print $3}' | awk -F '/' '{print $1}

NR==8 {print $3} 表示第8行的第3列

cat haproxy.log-20170102 |sed -n '/Jan 1 14:00:00/,/Jan 1 14:05:00/p'|grep 'packet/index'|awk '{print $6}'|cut -d : -f1|sort| uniq -c |sort -k1,1nr|awk '{ SUM += $1 } END { print SUM }' 对第一个字段进行汇总求和

-------------------------------------------------------------

说明:

awk被设计用于数据流，能够对列和行进行操作。而sed更多的是匹配，进行替换和删除。
awk有很多内建的功能，比如数组，函数等。灵活性是awk的最大优势。

awk的结构
awk '
BEGIN{ print "start"}
pattern { commands }
END{ print "end"}'
file
为了偏于观看，我打了回车，实际上是一行

一个awk脚本通常是3部分
1. BEGIN语句块
2. 能够使用模式匹配的通用语句块
3. END语句块
他们任何一部分都可以不出现在脚本中。脚本通常包含在双引号或者单引号内。
例如：

awk 'BEGIN{i=0}{i++}END{print i}' filename

工作原理

awk命令的工作方式如下：

1. 执行BEGIN{commands}语句块中的语句

2. 从文件或者stdin中读取一行，然后执行pattern{commands}. 迭代直到全部读取完毕

3. 最后执行END{commands}语句块

再次提醒，他们任何一部都可以没有

而awk的功能也远不止如此

入门实例：

echo | awk '{var1="v1";var2="v2";var3="v3"; print var1,var2,var3;}'
打印： v1 v2 v3

解释：逗号为定界符（分隔符）

echo | awk '{var1="v1";var2="v2";var3="v3"; print var1"-"var2"-"var3;}'

打印v1-v2-v3

解释：双引号为连接符

其他任何符号，都不能正常输出v1,v2,v3

解读--help（一个非常庞大复杂的帮助文档，官方用了410页的篇幅PDF来介绍，如果我只言片语，你信我自己都不信。。）

用法: awk [POSIX 或 GNU 风格选项] -f 脚本文件 [--] 文件 ...
用法: awk [POSIX 或 GNU 风格选项] [--] '程序' 文件 ...
POSIX 选项:             GNU 长选项:
    -f 脚本文件        --file=脚本文件
    -F fs            --field-separator=fs
指定输入文本分隔符，fs是一个字符串或者是一个正则表达式，
    -v var=val        --assign=var=val
将外部变量值付给var
    -m[fr] val
    -O            --optimize
启用一些优化程序的内部表示。
    -W compat        --compat
在兼容模式下运行awk。所以gawk的行为和标准的awk完全一样，所有的awk扩展都被忽略。
    -W copyleft        --copyleft
打印简短的版权信息
    -W copyright        --copyright
打印短版的通用公共许可证，然后退出
    -W dump-variables[=file]    --dump-variables[=file]
打印全局变量，其类型，提交的最终值的排序列表。
    -W exec=file        --exec=file
与-f类似，但与他有两点不同，（我回头把相关文档上传，太长）
    -W gen-po        --gen-po
（内容太多）
    -W help            --help 打印帮助
    -W lint[=fatal]        --lint[=fatal]
警告可疑或不移植到其他的awk实现的结构
    -W lint-old        --lint-old
打印关于不能向传统unix平台移植的结构的警告
    -W non-decimal-data    --non-decimal-data
启用自动输入数据的解释，八进制和十六进制值
    -W profile[=file]    --profile[=file]
启用awk程序剖析
    -W posix        --posix
在严格意义上的POSIX模式运作。
    -W re-interval        --re-interval
允许间隔表达式在正则表达式上
    -W source=program-text    --source=program-text
    -W traditional        --traditional
传统的Unix awk的正则表达式匹配
    -W usage        --usage
    -W use-lc-numeric    --use-lc-numeric
解析数字输入时，强制使用的语言环境中的小数点字符
数据
-W version        --version
提交错误报告请参考“gawk.info”中的“Bugs”页，它位于打印版本中的“Reporting
Problems and Bugs”一节

注意：gawk是awk的GNU版本，即使help ，在ubuntu下也需要先安装gawk

这回我们就不解读了，为了增加大家的信息和乐趣，先来点基本的：

部分特殊变量：

NR: 表示记录数量，在执行过程中对应于行号

NF：表示字段数量，在执行过程中对应于当前行的字段数

$0: 这个变量包含执行过程中当前行的文本内容

$1: 第一个字段的文本内容

$2: 第二个字段的文本内容

例子：

例1.

echo -e "line1 f2 f3\nline2 f4 f5\nline3 f6 f7"|\#这个\是在窗口中写多行命令用的
awk '{
print "Line no:"NR",No of fields:"NF, "$0="$0,"$1="$1,"$2="$2,"$3="$3
}'

小注一下：$1是打印第一个，$NF打印最后一个字段，$(NF-1)打印倒数第二个

例2.

seq 5 | awk 'BEGIN{ sum=0;print "Summation:"}{print $1"+";sum+=1}END{print "==";print sum}'

这个例子用到了基本格式。

BEGIN中初始化了sum,打印Summation

中间模块打印了第一列，然后给sum+1

END中打印了sum

例3. 关于-v 外部变量

$ VAR=10000
$echo | awk –v VARIABLE=$VAR'{print VARABLE}'

还有另一种灵活的方法可以将多个外部变量传递给awk，例如：

$var1="value1" var2="value2"
$echo | awk '{print v1,v2}' v1=$var1 v2=$var2

如果来自文件

awk '{print v1,v2}' v1=$var1 v2=$var2 filename

例4

$awk 'NR < 5' #行号小于5

$awk 'NR==1,NR==4' #行号在1到5之间的行

$awk '/linux/' #包含样式linux的行（可以用正则表达式指定样式）

$awk '!/linux/' #不包含样式linux的行

AWK用法整理的更多相关文章

grep，sed，awk用法整理
grep -c 打印出符合要求的行数 -i 忽略大小写 ignore -n 连同符号一起输出 num -v 打印出不符合要求的行 -A2 本行及下面两行 - ...
收集整理的awk用法小结
awk 用法:awk ‘ pattern {action} ‘ 变量名含义 ARGC 命令行变元个数 ARGV 命令行变元数组 FILENAME 当前输入文件名 FNR 当前文件中的记录号 FS 输 ...
CU社区shell板块awk十三问整理
CU社区shell板块awk十三问整理一.RS="" 当 RS="" 时,会将\n强制加入到FS变量中,因为RS为空时,是将连续多空行作为分隔符,近似于\n\ ...
linux学习：特殊符号，数学运算，图像与数组与部分终端命令用法整理
指令:let.expr.array.convert.tput.date.read.md5.ln.apt.系统信息一:特殊符号用法整理系统变量 $# 是传给脚本的参数个数 $0 是脚本本身的名字 $ ...
awk 用法（使用入门）
转自:http://www.cnblogs.com/emanlee/p/3327576.html awk 用法:awk ' pattern {action} ' 变量名含义 ARGC 命 ...
awk用法小结（作者总结）
http://www.chinaunix.net/old_jh/24/691456.html http://wenku.baidu.com/view/ebac4fc658f5f61fb736664d. ...
Spring JdbcTemplate用法整理
Spring JdbcTemplate用法整理: xml: <?xml version="1.0" encoding="UTF-8"?> <b ...
sed和awk用法
sed和awk用法 Sed sed是一个很好的文件处理工具,本身是一个管道命令,主要是以行为单位进行处理,可以将数据行进行替换.删除.新增.选取等特定工作,下面先了解一下sed的用法sed命令行格式为 ...
linq用法整理
linq用法整理普通查询 var highScores = from student in students where student.ExamScores[exam] > score se ...

随机推荐

Linq to sql 增删改查（转帖）
http://blog.csdn.net/pan_junbiao/article/details/7015633 (LINQ To SQL 语法及实例大全) 代码 Code highlightin ...
【python】字符串函数
1.String模块中的常量: string.digits:数字0~9 string.letters:所有字母(大小写) string.lowercase:所有小写字母 string.printabl ...
ubuntu初次设置root密码
初次安装ubuntu创建的用户不是root用户,但是需要root权限的时候又需要密码,那么如何设置密码呢? 很简单.如下几步操作
linux 异步信号的同步处理方式
关于代码的可重入性,设计开发人员一般只考虑到线程安全,异步信号处理函数的安全却往往被忽略.本文首先介绍如何编写安全的异步信号处理函数:然后举例说明在多线程应用中如何构建模型让异步信号在指定的线程中以同 ...
DOM操作之属性和样式操作
在DOM操作,除了前面的节点操作以外,常常被用到的操作还有属性操作和节点操作,下面,主要来总结一下jQuery中的属性操作方法和样式操作方法. 在开始操作前,我们需要先在html中添加如下代码,后面所 ...
Spring 注解方式实现 IOC 和 DI
注:以下所有测试案例(最后一个除外)的测试代码都是同一个: package cn.tedu.test; import org.junit.Test; import org.springframewor ...
python的类
一.语法 python类的机制是 C++ 的类机制和 Modula-3 的类机制的混合体: 允许多继承的类继承机制,派生类可以重写它父类的任何方法,一个方法可以调用父类中重名的方法: 1.动态特性: ...
长沙雅礼中学集训-------------------day3
今天的收获还是蛮大的,终于体会了一波在知识的海洋中遨游的美滋滋的快感. T1:给你N个点的位置和他们的速度,这些点向一个方向移动,求前M次超越者的集合A和被超越者的集合B(集合为这些点的速度),以及从 ...
php printf() 输出格式化的字符串
php printf() 函数用于输出格式化的字符串,本文章向码农介绍php printf()函数的使用方法和基本使用实例,感兴趣的码农可以参考一下. 定义和用法 printf()函数输出格式化的字符 ...
如何分析 WindowsDump：Dump 起源与初始设置
https://www.qcloud.com/community/article/511817 转者注:让我感觉以前看蓝屏都白看了~~~原来蓝屏也可以分析具体原因. 适用场景:Windows 系列系统 ...

AWK用法整理

AWK用法整理的更多相关文章

随机推荐

热门专题