awk是一个强大的文本分析工具,awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk语言的最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息,awk抽取信息后,才能进行其他文本操作。

使用方法

awk '{pattern+action} {filename}'

pattern 表示 AWK 在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令。

一. 初级篇

例子1:读取指定列的内容

(last -n:列出最近登陆系统的n个用户的信息)

[jihite@~]$last -5
jihite pts/4 :0.0 Mon Aug 18 23:00 still logged in
jihite pts/2 :0.0 Mon Aug 18 23:00 still logged in
jihite pts/1 :0.0 Mon Aug 18 23:00 still logged in
reboot system boot 3.2.0-61-generic Mon Aug 18 22:40 - 23:03 (00:23)
reboot system boot 3.2.0-61-generic Sat Aug 16 20:27 - 12:54 (16:26) wtmp begins Sat Aug 2 01:18:13 2014

现在利用awk命令只提取第一列的用户名

[jihite@~]$last -5 | awk '{print $1}'
jihite
jihite
jihite
reboot
reboot wtmp

awk工作流程:逐行读取(以‘\n’区分),默认以空格分开,$0是整行内容,$1是第一列内容。

如果只是显示/etc/passwd的账户

#cat /etc/passwd |awk  -F ':'  '{print $1}'
root
daemon
bin
sys

这种是awk+action的示例,每行都会执行action{print $1}。

-F指定域分隔符为':' (默认的域分隔符是空格)。

例子2:-F指定分割的符号

如果只是显示/etc/passwd的账户和账户对应的shell,而账户与shell之间以tab键分割

#cat /etc/passwd |awk  -F ':'  '{print $1"\t"$7}'
root /bin/bash
daemon /bin/sh
bin /bin/sh
sys /bin/sh

$1,$7之间以“\t”分开

例子3:在输出的开头和结尾添加输出

在所有行添加列名name,shell,在最后一行添加"blue,/bin/nosh"。

cat /etc/passwd |awk  -F ':'  'BEGIN {print "name,shell"}  {print $1","$7} END {print "blue,/bin/nosh"}'
name,shell
root,/bin/bash
daemon,/bin/sh
bin,/bin/sh
sys,/bin/sh
....
blue,/bin/nosh

awk工作流程是这样的:先执行BEGING,然后读取文件,读入有/n换行符分割的一条记录,然后将记录按指定的域分隔符划分域,填充域,随后开始执行模式所对应的动作action。接着开始读入第二条记录······直到所有的记录都读完,最后执行END操作。

例子4:搜索含有某关键字的行

(找出含有关键字‘man’的行)

[jihite@~]$cat '/etc/passwd' | awk -F : '/man/{print $0}'
man:x:::man:/var/cache/man:/bin/sh
colord:x:::colord colour management daemon,,,:/var/lib/colord:/bin/false

例子5:单双引号

双引号
awk '{print "\""}' #放大:awk '{print " \" "}'
单引号
awk '{print "'\''"}' # 放大: awk '{print " ' \ ' ' " }'

例给读出的每行内容加上单引号,行末还加上逗号

$cat del
12345
67890
abcde
fghig $cat del | awk '{print $1}'
12345
67890
abcde
fghig $cat del | awk '{print "'\''"$1"'\''"}'
'12345'
'67890'
'abcde'
'fghig' $cat del | awk '{print "'\''"$1"'\''"","}'
'12345',
'67890',
'abcde',
'fghig',

例子6:内置变量

ARGC               命令行参数个数
ARGV 命令行参数排列
ENVIRON 支持队列中系统环境变量的使用
FILENAME awk浏览的文件名
FNR 浏览文件的记录数
FS 设置输入域分隔符,等价于命令行 -F选项
NF 浏览记录的域的个数
NR 已读的记录数
OFS 输出域分隔符
ORS 输出记录分隔符
RS 控制记录分隔符

实例

[jihite@~]$awk  -F ':'  '{print "filename:" FILENAME ",linenumber:" NR ",columns:" NF}' /etc/passwd
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:
filename:/etc/passwd,linenumber:,columns:

二. 中级篇

| awk -F '\t' '{if($9^mohe) print $9}'

例子7:条件判断

把文件text中第二列大于10的行的第一列+“is expensive”输出

Banana  0.89
Paech 8.79
Kiwi 11.50
Pineapple 1.29
Apple 10.99
[@jihite]$ cat text | awk -F '\t' '$2 >= 10 {print $1, " is Expensive"}'
Kiwi is Expensive
Apple is Expensive

例子8:复合表达式

把文件text中第二列大于10的输出“is expensive”,小于9的输出“is cheap”

[@jihite]$ cat text | awk -F '\t' '$2 >= 10 {print $1, " is Expensive"}
$ <= {print $ " is cheap"}'
Banana is cheap
Paech is cheap
Kiwi is Expensive
Pineapple is cheap
Apple is Expensive

例子9:BEGIN END

[jihite@~]$cat Hurl_sort_copy| awk -F "\t" 'BEGIN{cnt=0}{cnt+=$3} END{print cnt}' 

e.g.

$cat del2
==>===>====>mod:len:
==>===>====>mod:len:
==>===>====>mod:len:
==>===>====>mod:len: $cat del2 | awk -F 'len:' 'BEGIN {sum=0} {sum += $2} END {print sum}'

显示中间过程

cat del | awk 'BEGIN {cnt=0}{print cnt"\t"$0}{cnt+=1}'  #表达式之间用{}隔开

例子10:if else

htext   text  | awk -F "\t" 'BEGIN {cntL=0;cntR=0} {if(NF>=9){cntL+=1} else {cntR+=1}} END {print cntL; print cntR}' #列数大于等于9的个数为cntL; 列数小于9的个数为cntR

awk案例学习的更多相关文章

  1. Storm入门2-单词计数案例学习

     [本篇文章主要是通过一个单词计数的案例学习,来加深对storm的基本概念的理解以及基本的开发流程和如何提交并运行一个拓扑] 单词计数拓扑WordCountTopology实现的基本功能就是不停地读入 ...

  2. angular的splitter案例学习

    angular的splitter案例学习,都有注释了,作为自己的备忘. <!DOCTYPE html> <html ng-app="APP"> <he ...

  3. 8.3 ContosoMVCWeb官方案例学习

    1. 分页案例学习 2. 排序搜索案例学习 3.使用Configuration.cs中的Seed方法 在数据库迁移过程中,使用update-database,会运行seed方法.seed方法能够将初始 ...

  4. 通过 Autostereograms 案例学习 OpenGL 和 OpenCL 的互操作性

    引言 在过去的十年里, GPU (图形处理单元)已经从特殊硬件(特供)转变成能够在数值计算领域开辟新篇章的高性能计算机设备. 很多算法能够使用拥有巨大的处理能力的GPU来快速运行和处理大数据量.即使在 ...

  5. GIS案例学习笔记-三维生成和可视化表达

    GIS案例学习笔记-三维生成和可视化表达 联系方式:谢老师,135-4855-4328,xiexiaokui#qq.com 目的:针对栅格或者矢量数值型数据,进行三维可视化表达 操作时间:15分钟 案 ...

  6. 获取字段唯一值工具- -ArcPy和Python案例学习笔记

    获取字段唯一值工具- -ArcPy和Python案例学习笔记   目的:获取某一字段的唯一值,可以作为工具使用,也可以作为函数调用 联系方式:谢老师,135-4855-4328,xiexiaokui# ...

  7. 面图层拓扑检查和错误自动修改—ArcGIS案例学习笔记

    面图层拓扑检查和错误自动修改-ArcGIS案例学习笔记 联系方式:谢老师,135_4855_4328,xiexiaokui#139.com 数据源: gis_ex10\ex01\parcel.shp, ...

  8. 计算平面面积和斜面面积-ArcGIS案例学习笔记

    计算平面面积和斜面面积-ArcGIS案例学习笔记 联系方式:谢老师,135_4855_4328,xiexiaokui#139.com 数据:实验数据\Chp8\Ex5\demTif.tif 平面面积= ...

  9. ArcGIS案例学习笔记2_2_等高线生成DEM和三维景观动画

    ArcGIS案例学习笔记2_2_等高线生成DEM和三维景观动画 计划时间:第二天下午 教程:Pdf/405 数据:ch9/ex3 方法: 1. 创建DEM SA工具箱/插值分析/地形转栅格 2. 生成 ...

随机推荐

  1. quartz2D简单使用

    quartz2D绘图 1:上下文:context,这个翻译不好理解,其实翻译环境更好一点,就是给了你一个画板,你看不到而已 在: CGContextRef ctx = UIGraphicsGetCur ...

  2. Bootstrap入门一:Hello Bootstrap

    一.Bootstrap简介 Bootstrap,来自 Twitter,是目前很受欢迎的前端框架.Bootstrap是基于 HTML5.CSS3和Javascriopt开发的,它在 jQuery的基础上 ...

  3. /lib64/libc.so.6: version `GLIBC_2.14' not found问题

    <备忘> 参考文章: https://my.oschina.net/zhangxu0512/blog/262275 问题答疑: http://blog.sina.com.cn/s/blog ...

  4. 如何实现SAP的RFC函数调用(原创)

    连接sap系统需要通过sap javaconnect来连接,对于sapjco.jar系列文件有32位与64位之分[32位用的JAR版本是 2.1.10 (2011-05-10) ,64位用的JAR版本 ...

  5. 关于ThreadLocal

    ThreadLocal是用于并发环境下避免竞争,简化编程的机制,它在并发环境下提供了一个逻辑上全局的访问点,来访问线程本地对象. 其实ThreadLocal并非是一个线程的本地实现版本,它并不是一个T ...

  6. web开发--文档下载

    GOOGLE在线文档下载地址分享(GOOGLE的文档地址暂不能用了,会放在其它位置..) GOOGLE的在线文档功能好象挂掉了...等找个其它存放的位置把这些文档再上传上去... 存在GOOGLE里面 ...

  7. 在listener或者工具中使用spring容器中的bean实例

    在项目中经常遇见需要在Listener中或者工具中使用Spring容器中的bean实例,由于bean不能在stataic的类中使用. 介绍一种方式: public class SpringTool { ...

  8. MyEclipse2015 编写js报 'Calculating completion proposals..' has encountered a problem.

    前言:编写js(按点后)弹出这个鬼东西,百度不到..估计是破解有问题.只有换版本了. 版本:MyEclipse 2015 stable 1.0 详细错误信息 解决:换成2.0版本

  9. poj 2711 Leapin' Lizards && BZOJ 1066: [SCOI2007]蜥蜴 最大流

    题目链接:http://poj.org/problem?id=2711 题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=1066 Your p ...

  10. 【BZOJ】【4010】【HNOI2015】菜肴制作

    拓扑排序 这题是要求N个点的一个拓扑序,且满足以下条件:编号1的位置尽可能靠前,在此基础上编号2的位置尽可能靠前…… 我看到这题的第一感觉:将拓扑排序用的队列改为优先队列,编号越小越早出来. 但是连样 ...