(1)awk工作原理
#awk -F: '{print $1,$3}' /etc/passwd
1)awk使用一行作为输入,并将这一行赋给内部变量$0,每一行也可称为一个记录,已换行符结束
2)然后行被:分割成字段,每个字段存储在已编号的变量中,从$1开始,最多达100个字段
3)awk如何知道用空格来分隔字段的呢,因为有一个内部变量FS来确定字段分割符。初始时FS被赋予空格
4)awk打印字段时,将以设置的方法使用print函数打印,awk在打印字段间加上空格,因为$1,$3之间有个逗号,逗号比较特殊,它映射为另一个内部变量,称为输出字段分割符OFS,OFS默认为空格
5)awk输出之后,将从文件中获取另一行,并将其存储在$0中,覆盖原来的内容,然后将新的字符串分割成字段并进行处理,该过程将持续到所有行处理完毕
(2)awk语法格式
1)语法格式:awk [options] 'command' filename
2)options
-F :定义输入字段分割符,默认的分隔符是空格或制表符(tab键)
3)command
BEGIN{}通常用于定义一些变量,例如BEGIN{FS=":";OFS="----"}
BEGIN{} {} END{}
行处理前 行处理 行处理后
# awk 'BEGIN{print 1/2}{print "ok"}END{print "-------"}' /etc/hosts
0.5
ok
ok
-------

4)命令格式:
awk 'pattern' filename 示例: awk -F:'/root/' /etc/passwd
awk '{action}' filename 示例:awk -F: '/root/{$1,$3}' /etc/passwd
awk 'pattern {action}' 示例:awk -F: '/root/{print $1,$3}' /etc/passwd
awk 'BEGIN{FS=":"}/root/{print $1,$3}' /etc/passwd
command | awk 'pattern{action}' 示例:df -P | grep "/" | awk '$4 > 25000 {print $0}'

(3)内部变量
$0:整行记录 示例:awk -F: '{print $0}' passwd
NR:行尾加个序号 示例:awk -F: '{print $0,NR}' passwd
FNR:行首加个序号 示例:awk -F: '{print FNR,$0}' passwd
NF:统计每行的字段数量 示例:awk -F: '{print $0,NF}' passwd
$NF:行最后一个字段 示例:awk -F: '{print $NF }' passwd awk -F: '{print $(NF-1)}' passwd
FS:输入字段分割符 示例:awk 'BEGIN{FS=":"}{print $1,$3}' /etc/passwd
  awk -F'[ :\t]' '/root/{print $1,$3}' /etc/passwd
  awk -F: '/root/{print $1,$3}' /etc/passwd
OFS:输出字段分隔符 示例:awk -F: '{print $1,$2,$3,$4}' /etc/passwd \\默认逗号就是空格
  awk 'BEGIN{FS=":";OFS="+++"}{print $1,$2,$3,$4}' /etc/passwd
ORS :输出行分隔符 示例:awk 'BEGIN{ORS=" "}{print $0}' passwd \\将文件合并成一行,ORS默认输出一条记录应该是回车,这里改成输出一条使用空格而不是换行符
RS:输入行分隔符 示例: # cat /etc/passwd | head -1 >passwd1
  awk 'BEGIN{RS=":"}{print $0}' passwd1 \\把一行内容根据分隔符输出成多行

总结:
字段分割符:FS OFS 默认空格或tab
行分隔符:RS ORS 默认换行符

(4)格式化输出
1)print函数
date | awk '{print "Mount:"$2 "\nYear:" $NF}'
awk -F: '{print "Username:" $1 "\tUid:" $3}' /etc/passwd
awk -F: '{print "Username,Uid:" $1,$3"!"}' /etc/passwd

2)printf函数
awk -F: '{printf "%-15s %-10s %-14s\n",$1,$2,$3}' /etc/passwd
%s:字符类型
%d:数值类型
%f:浮点类型
15:表示占用15个字符
- :表示左对齐,默认为右对齐
printf默认不会再行尾自动换行,加\n

(5)awk模式和动作
任何awk语句都由模式和动作组成,模式部分决定动作语句何时触发,模式可以是正则表达式,条件语句,复合语句
1)正则表达式
匹配整行:
#awk '/^root/' /etc/passwd
# awk '!/^root/' /etc/passwd
匹配字段:操作符(~ 或 ~!)
# awk -F: '$NF !~ /^bash/' /etc/passwd
# awk -F: '$1 ~ /^root/' /etc/passwd

2)关系运算符:< <= == != >= > 字符串比较需要双引号
awk -F: '$3 == 0' /etc/passwd
awk -F: '$3 < 10' /etc/passwd
awk -F: '$7 == "/bin/bash"' /etc/passwd
awk -F: '$1 ~ /root/' /etc/passwd
awk -F: '$1 !~ /root/' /etc/passwd
df -P | awk '$4 > 25000'
3)条件表达式
awk -F: '$3>300{print $0}' /etc/passwd
awk -F: '{if($3>300)print $0}' /etc/passwd
awk -F: '{if ($3>300){print $0}}' /etc/passwd
awk -F: '{if($3>300){print $3}else{print$1}}' /etc/passwd
4)算术运算:+ - * / % ^
awk -F: '{if($3*10 > 140 ){print $0}}' /etc/passwd
5)逻辑运算符:&&与 ||或 !
awk '$1~/root/ && $3<15' /etc/passwd
awk '!($1~/root/ && $3<15)' /etc/passwd
(6)awk脚本编程之条件判断
1)if语句 语法格式:{if(表达式){语句;语句;...}}
awk -F":" '{if($3 == 0){print $1,"is administrator!"}}' /etc/passwd
awk -F":" '{if($3>0 && $3<1000){count++;}} END{print count}' /etc/passwd \\统计系统用户数
2)if..else语句
语法格式:{if(表达式){语句;} else{语句;}}
awk -F":" '{if($3 == 0){count++;}else{i++;}} END{print "管理员个数:"count;print "系统用户数:"i}' /etc/passwd
3)if..else if..else语句 {if(表达式){语句} else if(表达式){语句} else{语句}}
awk -F":" '{if($3 == 0){count++;} else if($3>0 && $3<1000){i++;} else{j++}} END{print "管理员个数:"count;print "系统用户数:"i;print "普通用户数:"j}' /etc/passwd
(7)awk脚本编程之while循环
1)语法:{初始值;while(条件){语句;语句}}
awk 'BEGIN{i=1;while(i<=10){print i;i++}}' \\打印1到10
awk -F":" '{i=1;while(i<=7){print $i;i++}}' /etc/passwd
awk '{i=1;while(i<=NF){print $i;i++}}' /etc/hosts \\打印每行的字段

(8)awk脚本编程之for循环
1)语法:{for(条件){语句}}
awk 'BEGIN{for(i=1;i<=10;i++){print i}}'
awk '{for(i=1;i<=NF;i++){print $i}}' /etc/hosts 等同于awk '{i=1;while(i<=NF){print $i;i++}}' /etc/hosts

(9)awk脚本编程之数组:把需要遍历的对象作为数组的索引
awk '{数组名[遍历对象]++} END{for(i in 数组名){print i,数组名[i]}}'

统计shell种类: awk -F":" '{shells[$NF]++} END{for(i in shells){print i,shells[i]}}' /etc/passwd
统计网站状态:netstat -ant | grep '\b192.168.1.253:80\b' | awk '{status[$NF]++} END{for(i in status){print i,status[i]}}'
ss -an | grep "\b192.168.1.2:80\b" | awk '{status[$1]++} END{for(i in status){print i,status[i]}}'
统计当前访问的每个ip数量:
netstat -ant| grep "\b192.168.1.2:80\b" | awk -F '[ :]+' '{ip_count[$6]++} END{for(i in ip_count){print i,ip_count[i]}}'| sort -k2 -rn

(10)awk函数:
统计用户名是4个字符
#awk -F: '$1 ~ /^....$/{count++;print $1} END{print "count is:"count}' /etc/passwd
#awk -F: 'length($1)==4{count++;print $1} END{print "count is:"count}' /etc/passwd
(11)awk引用外部变量
打印挂载分区使用容量超过10%的分区 ,这里int($5)取整数
df -h | awk -v i=10 '{if(int($5) > i){print $6":"$5}}'

(4)三剑客之awk的更多相关文章

  1. Linux实战教学笔记18:linux三剑客之awk精讲

    Linux三剑客之awk精讲(基础与进阶) 标签(空格分隔): Linux实战教学笔记-陈思齐 快捷跳转目录: * 第1章:awk基础入门 * 1.1:awk简介 * 1.2:学完awk你可以掌握: ...

  2. (转)不看绝对后悔的Linux三剑客之awk实战精讲

    原文:http://blog.51cto.com/hujiangtao/1923930 一.Linux三剑客之awk命令精讲 第1章 awk基础入门 1.1 awk简介 awk不仅仅时linux系统中 ...

  3. shell编程系列21--文本处理三剑客之awk中数组的用法及模拟生产环境数据统计

    shell编程系列21--文本处理三剑客之awk中数组的用法及模拟生产环境数据统计 shell中的数组的用法: shell数组中的下标是从0开始的 array=("Allen" & ...

  4. shell编程系列20--文本处理三剑客之awk常用选项

    shell编程系列20--文本处理三剑客之awk常用选项 awk选项总结 选项 解释 -v 参数传递 -f 指定脚本文件 -F 指定分隔符 -V 查看awk的版本号 [root@localhost s ...

  5. shell编程系列19--文本处理三剑客之awk中的字符串函数

    shell编程系列19--文本处理三剑客之awk中的字符串函数 字符串函数对照表(上) 函数名 解释 函数返回值 length(str) 计算字符串长度 整数长度值 index(str1,str2) ...

  6. shell编程系列18--文本处理三剑客之awk动作中的条件及if/while/do while/for循环语句

    shell编程系列18--文本处理三剑客之awk动作中的条件及if/while/do while/for循环语句条件语句 if(条件表达式) 动作1 else if(条件表达式) 动作2 else 动 ...

  7. shell编程系列17--文本处理三剑客之awk动作中的表达式用法

    shell编程系列17--文本处理三剑客之awk动作中的表达式用法 awk动作表达式中的算数运算符 awk动作中的表达式用法总结: 运算符 含义 + 加 - 减 * 乘 / 除 % 模 ^或** 乘方 ...

  8. shell编程系列16--文本处理三剑客之awk模式匹配的两种方法

    shell编程系列16--文本处理三剑客之awk模式匹配的两种方法 awk的工作模式 第一种模式匹配:RegExp 第二种模式匹配:关系运算匹配 用法格式对照表 语法格式 含义 RegExp 按正则表 ...

  9. shell编程系列15--文本处理三剑客之awk格式化输出printf

    shell编程系列15--文本处理三剑客之awk格式化输出printf printf的格式说明符 格式符 含义 %s 打印字符串 %d 打印十进制数 %f 打印一个浮点数 %x 打印十六进制数 %o ...

  10. shell编程系列14--文本处理三剑客之awk的概述及常用方法总结

    shell编程系列14--文本处理三剑客之awk的概述及常用方法总结 awk是一个文本处理工具,通常用于处理数据并生成结果报告 awk的命名是它的创始人 Alfred Aho.Peter Weinbe ...

随机推荐

  1. springboot ueditor 使用心得

    1.将ueditor引入项目中会发现,图片不能上传,返回值意思是因配置文件错误,导致图片无法上传 默认情况是使用jsp初始配置文件,这就需要项目支持jsp解析 在maven中引入 <!--添加对 ...

  2. 【bzoj1123】[POI2008]BLO DFS树

    题目描述 Byteotia城市有n个 towns m条双向roads. 每条 road 连接 两个不同的 towns ,没有重复的road. 所有towns连通. 输入 输入n<=100000 ...

  3. DataTable定义

    DataTable是一个临时保存数据的网格虚拟表(表示内存中数据的一个表.).DataTable是ADO dot net 库中的核心对象.它可以被应用在 VB 和 ASP 上.它无须代码就可以简单的绑 ...

  4. Intel QuickAssist Technology and OpenSSL – Benchmarks and Setup Tips

    Intel QuickAssist Technology and OpenSSL – Benchmarks and Setup Tips 来源:https://www.servethehome.com ...

  5. [Leetcode] Populating next right pointer in each node ii 填充每个节点的右指针

    Follow up for problem "Populating Next Right Pointers in Each Node". What if the given tre ...

  6. BZOJ2115 [Wc2011] Xor 【线性基】

    2115: [Wc2011] Xor Time Limit: 10 Sec  Memory Limit: 259 MB Submit: 3915  Solved: 1633 [Submit][Stat ...

  7. 安徽师大附中%你赛day4T1 金字塔 解题报告

    金字塔 题目背景: \(Zdrcl\)带着妹子们来到了胡夫金字塔周边旅游, 发现这里正在进行一个有关金字塔的游戏 题目描述: 游戏规则如下: 1. 这里的金字塔是一个 \(N\) 阶的二维金字塔. 2 ...

  8. POJ3159:Candies(差分约束)

    Candies Time Limit: 1500MS   Memory Limit: 131072K Total Submissions: 39666   Accepted: 11168 题目链接:h ...

  9. 7月21号day13总结

    今天学习过程和小结 学习了hive中的数据类型以及hive的简单查询, 学习了sqoop version用sqoop导入导出数据. 主要用于在Hadoop(Hive)与传统的数据库(mysql.pos ...

  10. Linux设置虚拟内存-创建和启用Swap交换区

    如果你的服务器的总是报告内存不足,并且时常因为内存不足而引发服务被强制kill的话,在不增加物理内存的情况下,启用swap交换区作为虚拟内存是一个不错的选择,如果是SSD硬盘,正常读写速度都在300M ...