前言
文本处理三剑客中,grep强在文本查找,sed强在文本处理,现awk强在文本查找后的输出处理。awk可以在处理文本的过程中使用编程结构(变量、条件判断、循环)以及其内置的变量,这就是它强大的地方。
语法结构
awk [options] 'program' file file ...
awk [options] 'PATTERN{action}' file file ...
① 各项目之间使用逗号分隔,而输出时则使用输出分隔符分隔
② 输出的各item可以字符串或数值、当前记录的字段、变量或awk的表达式,数值会被隐式转换为字符串后输出
③ print后面item如果省略,相当于print $0,若输出空白,使用pirnt ""
options
-F:指定输入分隔符
-v:自定义变量
PATTERN
① Regexp: 格式为/PATTERN/,仅处理被/PATTERN/匹配到的行
② Expression: 表达式,其结果为非0或非空字符串时满足条件,仅处理满足条件的行
③ Ranges: 行范围,此前地址定界,startline, endline,仅处理范围内的行
④ BEGIN/END: 特殊模式,仅在awk命令的program运行之前(BEGIN)或运行之后(END)执行一次
⑤ Empty:空模式,匹配任行
常用的action
①Expressions:表达式 赋值等
② Control statements:条件语句,控制语句if while...
③Compound statements:组合语句
④ input statements:输入语句
⑤ output statements:输出语句
关于变量及其操作
内置变量
FS:Field Seperator, 输入时的字段分隔符
RS:Record Seperator, 输出行分隔符
OFS: Output Field Seperator, 输出时的字段分隔符;12121212
ORS: Outpput Row Seperator, 输出时的行分隔符;
NR:Numbers of Record, 行数;代表当前所处理的行是第几行
NF:Numbers of Field, 字段数;代表当前所处理的行所包含的所有字段
FNR:行数;各文件分别计数;
1212
ARGV:数组,保存命令本身这个字符,awk '{print $0}' 1.txt 2.txt,意味着ARGV[0]保存awk
ARGC: 保存awk命令中参数的个数
FILENAME: awk正在处理的当前文件的名称
自定义变量
-v var_name=VALUE #变量名区分字符大小写
①可以program中定义变量
awk -v A="test" 'BEGIN{print A}'
② 可以命令行中通过-v选项自定义变量
awk 'BEGIN{A="test";print A}'
操作符
算术操作符:
x+y
x-y
x*y
x/y
x**y, x^y
x%y
-x:负值
+x:转换为数值
字符串操作符:连接
赋值操作符:
=
+=
-=
*=
/=
%=
^=
**=
++
--
如果模式自身是=号,要写为/=/
比较操作符:
<
<=
>
>=
==
!=
~:模式匹配,左边的字符串能够被右边的模式所匹配为真,否则为假;
!~:不匹配为真,匹配为假
逻辑操作符:
&&: 与
||:或
条件表达式:
selector?if-true-expression:if-false-expression
函数调用:
function_name(argu1,argu2)
printf命令
printf format, item1, item2,...
① 要指定format
②不会自动换行;如需换行则需要给出\n
③format用于为后面的每个item指定其输出格式
format格式的指示符都%开头,后跟一个字符:
%c: 显示字符的ASCII码;
%d, %i: 十进制整数;
%e, %E: 科学计数法显示数值;
%f: 显示浮点数;
%g, %G: 以科学计数法格式或浮点数格式显示数值;
%s: 显示字符串;
%u: 显示无符号整数;
%%: 显示%自身;
修饰符:
#:显示宽度
-:左对齐
+:显示数值的符号
.#: 取值精度
举例
awk 'BEGIN{str=65;printf "%c\n",str}'
awk 'BEGIN{str=3.14159;printf "%.2f\n",str}'
awk -F : '{printf "%+10s %-5d\n", $1,$3}' /etc/passwd
print的输出重定向
print items > output-file #保存到某文件
print items >> output-file #追加到某文件
print items | command #使用管道交给某些命令处理
特殊文件描述符:
/dev/stdin: 标准输入
/dev/stdout: 标准输出
/dev/stderr: 错误输出2347
控制语句
if-else
格式:if (condition) {then body} else {else body}
# awk -F: '{if ($3>=500) {print $1,"is a common user"} else {print $1, "is an admin or system user"}}' /etc/passwd
# awk '{if (NF>=8) {print}}' /etc/i12
while
格式:while (condition) {while body}
# awk '{i=1; while (i<=NF){printf "%s ",$i;i+=2};print ""}' /etc/inittab
# awk '{i=1; while (i<=NF){if (length($i)>=6) {print $i}; i++}}' /etc/inittab
length()函数:取字符串的长度
do-while
格式:do {do-while body} while (condition)
for
格式:for (variable assignment; condition; iteration process) {for body}
# awk '{for (i=1;i<=NF;i+=2){printf "%s ",$i};print ""}' /etc/inittab
# awk '{for (i=1;i<=NF;i++){if (length($i)>=6) print $i}}' /etc/inittab
for循环可用来遍历数组元素:
语法:for (i in array) {for body}
case
语法:switch (expression) {case VALUE or /RGEEXP/: statement1;... default: stementN}
循环控制
break
continue
next
提前结束对本行的处理进而进入下一行的处理;
# awk -F: '{if($3%2==0) next;print $1,$3}' /etc/passwd
# awk -F: '{if(NR%2==0) next; print NR,$1}' /etc/passwd
数组
关联数组:
array[index-expression]
index-expression: 可以使用任意字符串; 如果某数组元素事先不存在,那么在引用时,awk会自动创建此元素并将其初始化为空串;因此,要判断某数组是否存在某元素,必须使用“index in array”这种格式;
A[first]="hello awk"
print A[second]
要遍历数组中的每一个元素,需要使用如下特殊结构:
for (var in array) {for body}
其var会遍历array的索引;
state[LISTEN]++
state[ESTABLISHED]++
举例:
# netstat -tan | awk '/^tcp/{++state[$NF]}END{for (s in state) {print s,state[s]}}'
# awk '{ip[$1]++}END{for (i in ip) {print i,ip[i]}}' /var/log/httpd/access_log
删除数组元素:
delete array[index]
awk的内置函数
split(string,array[,fieldsep[,seps]]):
功能:将string表示的字符串以fieldsep为分隔符进行切片,并切片后的结果保存至array为名的数组中;数组下标从1开始;
root:x:0:0::/root:/bin/bash
user[1]="root", user[2]
此函数有返回值,返回值为切片后的元素的个数
# netstat -tn | awk '/^tcp/{lens=split($5,client,":");ip[client[lens-1]]++}END{for (i in ip) print i,ip[i]}'
length(string)
功能:返回给定字串的长度12121212
substr(string,start[,length])
功能:从string中取子串,从start为起始位置为取length长度的子串;
# awk -F: '{if ($3>=500) {print $1,"is a common user"} else {print $1, "is an admin or system user"}}' /etc/passwd
# awk '{if (NF>=8) {print}}' /etc/i12
- linux awk命令详解
linux awk命令详解 简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分 ...
- awk命令详解
搜索 纠正错误 添加实例 awk 文本和数据进行处理的编程语言 补充说明 awk 是一种编程语言,用于在linux/unix下对文本和数据进行处理.数据可以来自标准输入(stdin).一个或多个文件 ...
- Linux安全基础:awk命令的使用
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各 ...
- AWK命令学习
使用方法 awk 'pattern {action}' {filenames} 尽管操作可能会很复杂,但语法总是这样,其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到 ...
- awk 命令
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各 ...
- AWK命令的用法
1.awk命令简介: awk是一种可以处理数据.产生格式化报表的语言,功能十分强大. awk的工作方式是读取数据,将每一行数据视为一条记录(record)每笔记录以字段分隔符分成若干字段,然后输出各个 ...
- [Linux] linux awk命令详解
reference : http://www.cnblogs.com/ggjucheng/archive/2013/01/13/2858470.html 简介 awk是一个强大的文本分析工具,相对于g ...
- awk命令简单介绍
简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再 ...
- Linux的awk命令
简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再 ...
- awk命令--update20150120
简介 awk是一个强大的文本分析工具,把文件逐行读入,以空格为默认分隔符分割成field,切开的部分再进行各种分析处理. 模式和动作: 任何awk语句都是由模式和动作组成,模式部分决定动作语句何时触发 ...
随机推荐
- 洛谷——P1130 红牌
题目描述 某地临时居民想获得长期居住权就必须申请拿到红牌.获得红牌的过程是相当复杂 ,一共包括N个步骤.每一步骤都由政府的某个工作人员负责检查你所提交的材料是否符合条件.为了加快进程,每一步政府都派了 ...
- jzyzOJ 1658【bzoj1798改编】
#include<iostream> #include<cstring> #include<cstdio> #include<ctime> #inclu ...
- Docking For WPF–AvalonDock
桌面程序的应用,不可避免的就会用到大量的布局控件,之前的一个项目也想过去做类似于Visual Studio的那种灵活的布局控件,也就是界面上的控件能够实现拖拽放置.隐藏.窗口化等一系列的操作,但由于开 ...
- django博客开发
找一文件夹作为项目文件夹1 django-admin.py startproject mysite建立工程2 cd mysite python manage.py startapp blog 建立第一 ...
- (转)python request用法
强烈推荐!requests官方文档已有了中文版,请见http://cn.python-requests.org/zh_CN/latest/ requests是python的一个HTTP客户端库,跟ur ...
- Cocos2d-x 3.0 屏幕触摸及消息分发机制
***************************************转载请注明出处:http://blog.csdn.net/lttree************************** ...
- win10中以管理员身份启动notepad、cmd、editplus
win10中以管理员身份启动notepad.cmd 在开始菜单中输入,出现了之后再进行右键点击,选择管理员身份运行: 而且editplus也可以“管理员身份运行”,再也不用担心我改不了hosts了: ...
- WinForm启动时接收参数
1 默认的Main函数,修改如下: static class Program { /// <summary> /// 应用程序的主入口点. /// </summary> [ST ...
- Android的Framework分析---5 ActivityManager分析
Android系统开发交流群:484966421 OSHome. 微信公众号:oshome2015 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font ...
- mongodb springdata 问题处理
发现spring4-mongo3.2.1 加上用户名密码认证后无法认证的问题. 1.必须在当前使用的数据库下建用户,权限可以给readWrite 2.由于mongodb2和mongodb3的用户认证方 ...