awk是一种用于处理文本、模式匹配的编程语言。与sed和grep,俗称Linux下的三剑客。学会 awk 等于你在 Linux 命令行里,又多了一种处理文本的选择。这篇文章重点教你如何使用,看完这篇文章,就大致知道如何使用了,力求简单使用

术语铺垫

在awk的文本处理规则里,awk将文本文件视为由字段和记录组成的文本数据库。默认情况下,awk将每一行视为一个记录,也就是说记录的分隔符是\n,记录的分隔符可以通过内置变量RS更改。

在每一个记录中,又把记录分为若干个字段,即记录由字段组成,而字段的默认分隔符为空格或制表符。

一、基础用法

和我们平常使用的 Linux 命令一样, awk 也是遵循着某种格式来使用,格式如下:

# 使用格式
awk 执行的事件 文件 # 例如:
[root@iamshuaidi ~]# awk '{print $0}' test.txt
my first language:Java
second languange:python
third language:C


其中,print 表示打印,$0 表示一整个记录,test.txt 表示一个文件。所以

awk '{print $0}' test.txt

表示把 test.txt 文件里面的每行记录都打印出来。

刚才我们说,记录是由字段组成的,且字段的默认分隔符是空格或者制表符。下面我们打印每一个记录的第一个字段,如下:

# 打印每一行的第一个字段
[root@iamshuaidi # awk '{print $1}' test.txt
my
second
third

$0 表示整个记录,不过 $1, $2, $3.....则表示整个记录中的第一个字段,第二个字段......。

刚才我们说字段的默认分隔符是空格或者制表符这些,默认意味着我们可以自己显式着指定分隔符。下面我们用“:”来作为我们的分隔符吧。

# 打印第二个字段
[root@iamshuaidi ~]# awk -F ':' '{print $2}' test.txt
Java
python
C

上面我们用参数 -F 指定了我们的分隔符,即如果想要指定字段的分隔符,可以用参数 -F 指定分隔符。

二、条件限制

在打印文本的时候,我们可以指定一些条件。格式如下:

awk 参数 条件 要执行的动作 文件

例如我们指定分隔符为“:”,条件为第二个字段为"Java"的记录。

# 打印第二个字段为"Java"的文本
[root@iamshuaidi ~]# awk -F ':''$2 == "Java" {print $2}' test.txt
Java

打印奇数行的的第二个字段:

# 打印奇数行的记录
[root@iamshuaidi ~]# awk -F ':' 'NR % 2 == 1 {print $2}' test.txt
Java
C

其中,NR 是一个内置的变量,表示当前正在处理的记录,即当前的记录是第几个记录。

三、条件语句

和我们平常的编程一样,awk 也提供了 if, else, while 等这些条件语句。

例如,打印第二个及其之后的记录:

root@iamshuaidi ~]# awk '{if(NR > 1) print $2}' test.txt
languange:python
language:C

注意,上面的字段分隔符是空格了,并且 if 语句是在“{}” 里指定的。

再看一个例子:

# 如果第一个字段大于“s",则打印第一个字段,否则打印第二个字段
[root@iamshuaidi ~]# awk '{if($1 < "s") print $1; else print $2}' test.txt
my
languange:python
language:C

  

上面打印的是:如果第一个字段大于“s",则打印第一个字段,否则打印第二个字段。

四、函数

awk 提供了一些内置函数来供我们使用,一下常用的函数如下:

tolower():字符转为小写。
toupper():字符转为大写
length():返回字符串长度。
substr():返回子字符串。
sqrt():平方根。
rand():随机数。

例如,我们要把打印的字段转化为大小

# 第一个字段转化为大写输出
[root@iamshuaidi ~]# awk '{print toupper($1)}' test.txt
MY
SECOND
THIRD

五、变量

刚才我们说 NR 是一个表示当前正在处理的记录是第几个记录的内置变量,常用的内置变量如下:

NR:表示当前处理的是第几行
NF:表示当前行有多少个字段
FILENAME:当前文件名
FS:字段分隔符,默认是空格和制表符。
RS:行分隔符,用于分割每一行,默认是换行符。
OFS:输出字段的分隔符,用于打印时分隔字段,默认为空格。
ORS:输出记录的分隔符,用于打印时分隔记录,默认为换行符。

例如我们要打印每一个记录的最后一个字段,就可以使用变量 NF 了。

root@iamshuaidi ~]# awk '{print $NF}' test.txt
language:Java
languange:python
language:C

对了,刚才那个 NR 的变量也是挺好用的,例如:

# 标记当前是第几行,这样看起来好像比较舒服?
[root@iamshuaidi ~]# awk '{print NR ". " $0}' test.txt
1. my first language:Java
2. second languange:python
3. third language:C

讲到这里就大致结束了,这篇文章算是入门文章,屏蔽了很多细节,大致介绍一下怎么使用,更多具体用法,可以根据自己想要实现的功能去查找相关函数哦。

个人公众号:【苦逼的码农】,分享各种技术干货

为方便交流,创建了个qq交流群:822241847,用来分享一些学习资源,面试干货。
欢迎你的加

一篇文章带你学会Linux三剑客之一:awk的更多相关文章

  1. 一篇文章带你了解服务器操作系统——Linux简单入门

    一篇文章带你了解服务器操作系统--Linux简单入门 Linux作为服务器的常用操作系统,身为工作人员自然是要有所了解的 在本篇中我们会简单介绍Linux的特点,安装,相关指令使用以及内部程序的安装等 ...

  2. 一篇文章带你了解热门版本控制系统——Git

    一篇文章带你了解热门版本控制系统--Git 这篇文章会介绍到关于版本控制的相关知识以及版本控制神器Git 我们可能在生活中经常会使用GitHub网页去查询一些开源的资源或者项目,GitHub就是基于G ...

  3. 一篇文章带你了解网页框架——Vue简单入门

    一篇文章带你了解网页框架--Vue简单入门 这篇文章将会介绍我们前端入门级别的框架--Vue的简单使用 如果你以后想从事后端程序员,又想要稍微了解前端框架知识,那么这篇文章或许可以给你带来帮助 温馨提 ...

  4. 一篇文章带你了解NoSql数据库——Redis简单入门

    一篇文章带你了解NoSql数据库--Redis简单入门 Redis是一个基于内存的key-value结构数据库 我们会利用其内存存储速度快,读写性能高的特点去完成企业中的一些热门数据的储存信息 在本篇 ...

  5. 一篇文章带你了解轻量级Web服务器——Nginx简单入门

    一篇文章带你了解轻量级Web服务器--Nginx简单入门 Nginx是一款轻量级的Web服务器/反向代理服务器及电子邮件代理服务器 在本篇中我们会简单介绍Nginx的特点,安装,相关指令使用以及配置信 ...

  6. MYSQL(基本篇)——一篇文章带你走进MYSQL的奇妙世界

    MYSQL(基本篇)--一篇文章带你走进MYSQL的奇妙世界 MYSQL算是我们程序员必不可少的一份求职工具了 无论在什么岗位,我们都可以看到应聘要求上所书写的"精通MYSQL等数据库及优化 ...

  7. MYSQL(进阶篇)——一篇文章带你深入掌握MYSQL

    MYSQL(进阶篇)--一篇文章带你深入掌握MYSQL 我们在上篇文章中已经学习了MYSQL的基本语法和概念 在这篇文章中我们将讲解底层结构和一些新的语法帮助你更好的运用MYSQL 温馨提醒:该文章大 ...

  8. 一篇文章教你学会ASP.Net Core LINQ基本操作

    一篇文章教你学会ASP.Net Core LINQ基本操作 为什么要使用LINQ LINQ中提供了很多集合的扩展方法,配合lambda能简化数据处理. 例如我们想要找出一个IEnumerable< ...

  9. 一篇文章带你掌握主流数据库框架——MyBatis

    一篇文章带你掌握主流数据库框架--MyBatis MyBatis 是一款优秀的持久层框架,它支持自定义 SQL.存储过程以及高级映射. 在之前的文章中我们学习了MYSQL和JDBC,但是这些东西远远不 ...

随机推荐

  1. Typescript骚操作,在TS里面直接插入HTML

    Typescript骚操作,在TS里面直接插入HTML,还有语法提示 先给大家看一个图 因为我不喜欢用很重的框架,主要是并非专业UI,但是偶尔会用到,还是觉得直接element组装受不了,想想能在ts ...

  2. linux shell 发送qq邮件失败

    安装 发送邮件功能 yum -y install postfix yum -y install mailx 使用 mail -s “fsfds” @qq.com < hh 第二次返回此信息 您在 ...

  3. [jzoj]3506.【NOIP2013模拟11.4A组】善良的精灵(fairy)(深度优先生成树)

    Link https://jzoj.net/senior/#main/show/3506 Description 从前有一个善良的精灵. 一天,一个年轻人B找到她并请他预言他的未来.这个精灵透过他的水 ...

  4. hadoop常用操作命令

    #############centos6.8IP常用操作命令#######################DEVICE=eth0TYPE=EthernetONBOOT=yesNM_CONTROLLED ...

  5. css中文字体解决方案

    html { font-family: -apple-system, "Noto Sans", "Helvetica Neue", Helvetica, &qu ...

  6. .net 发布程序时出现“类型ASP.global_asax同时存在于...”错误的解决办法

    web程序发布后,通过浏览器访问程序显示如下的错误信息: 编译器错误消息: CS0433: 类型“ASP.global_asax”同时存在于“c:\WINDOWS\Microsoft.NET\Fram ...

  7. Cmd命令 查看端口被占用

    1)第一步 打开cmd命令窗口,输入命令:netstat -ano|findstr 输入端口号 2)第二步 继续输入命令:tasklist|findstr  第一步查询到的进程号 3)第三步 根据第二 ...

  8. Python函数式编程之lambda表达式

    一:匿名函数的定义 lambda parameter_list: expression 二:三元表达式 条件为真时返回的结果 if 条件判断 else 条件为假的时候返回的结果 三:map map(f ...

  9. 让MEF插上AOP的翅膀

    什么是MEF Git:https://github.com/MicrosoftArchive/mef MEF也是一款ioc框架,貌似历史比较悠久了. 这里有一篇.net阵容里面主流ioc比较. htt ...

  10. js深度复制三种方法

    1.用递归的方式进行深度复制 2.用JSON.stringify加上JSON.parse()进行深度复制 3.用jquery中自带的方法$.extend()进行深度复制 具体实现代码可百度自行查询