Linux命令awk

1.简介
awk是一个强大的文本分析工具，相对于grep的查找，sed的编辑，awk在其对数据分析并生成报告时，显得尤为强大。
简单来说awk就是把文件逐行读入，默认以空格为分隔符将每行切片，切开的部分再进行各种分析处理。

2.使用方法

awk '{pattern + action}' {filenames}

其中 pattern 表示 awk 在数据中查找的内容，而 action 是在找到匹配内容时所执行的一系列命令。

花括号 {} 不需要在程序中始终出现，但它们用于根据特定的模式对一系列指令进行分组。
pattern就是要表示的正则表达式，用斜杠括起来。

awk语言的最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息
awk抽取信息后，才能进行其他文本操作。完整的awk脚本通常用来格式化文本文件中的信息
通常，awk是以文件的一行为处理单位的，awk每接收文件的一行，然后执行相应的命令，来处理文本。

3.调用awk
3.1.命令行方式

awk [-F  field-separator]  'commands'  input-file(s)

其中，commands 是真正awk命令，[-F域分隔符]是可选的。 input-file(s) 是待处理的文件。
在awk中，文件的每一行，由域分隔符分开的每一项称为一个域。通常，在不指名-F域分隔符的情况下，默认的域分隔符是空格。

3.2.将所有的awk命令插入一个单独文件，然后调用：

awk -f awk-script-file input-file(s)

　　其中，-f选项加载awk-script-file中的awk脚本，input-file(s)跟上面的是一样的。
4.入门实例
需求：只显示 /etc/passwd 的账户和账户对应的shell，而账户与shell之间以逗号分割，而且在所有行添加列名name，shell，在最后一行添加 "blue,/bin/nosh"。

#cat /etc/passwd |awk  -F ':'  'BEGIN {print "name,shell"}  {print $1","$7} END {print "blue,/bin/nosh"}'

  name,shell

  root,/bin/bash

  daemon,/bin/sh

  ....

  blue,/bin/nosh

先执行BEGIN，然后读入有 /n 换行符分割的一条记录，然后将记录按指定的域分隔符划分域。
-F指定域分隔符为':'，默认域分隔符是"空白键" 或 "[tab]键"
填充域，$0 表示所有域，$1表示第一个域，$n表示第n个域，
随后开始执行模式所对应的动作 action 即{print $1","$7}。
接着开始读入第二条记录······
直到所有的记录都读完，最后执行END操作。

需求：搜索/etc/passwd有 root 关键字的所有行，并显示对应的shell

# awk -F: '/root/{print $7}' /etc/passwd

/bin/bash
其中， /root/ 中的 root 是awk的pattern（匹配包含root的行），表示要查找的数据。awk中的action是{print $7}

Linux命令awk的更多相关文章

【转】如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等
如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等你是否曾经有过要计算一个非常大的数据(几百GB)的需求?或在里面搜索,或其它操作——一些无法并 ...
<转>如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等
原文链接:http://www.vaikan.com/use-multiple-cpu-cores-with-your-linux-commands/ 你是否曾经有过要计算一个非常大的数据(几百GB) ...
转摘--如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等
http://www.vaikan.com/use-multiple-cpu-cores-with-your-linux-commands/ 你是否曾经有过要计算一个非常大的数据(几百GB)的需求?或 ...
如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等(转)
你是否曾经有过要计算一个非常大的数据(几百GB)的需求?或在里面搜索,或其它操作——一些无法并行的操作.数据专家们,我是在对你们说.你可能有一个4核或更多核的CPU,但我们合适的工具,例如 grep, ...
linux命令-awk入门
最近经常查看nginx日志,有时候需要做一些统计分析,于是就想起了awk,学习了就顺便做一个记录. 目录概述:简单介绍awk背景原理基本用法:常用到的awk语法内建变量综合实例概述 awk是 ...
[ Linux 命令 ] awk
一.AWK简介 awk:报告生成器,是以行为单位进行处理,并格式化后显示 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说a ...
linux命令-awk，sort,uniq
学习地址:http://man.linuxde.net/awk#awk的工作原理 awk 选项参数说明: -F fs or --field-separator fs 指定输入文件折分隔符,fs是一个字 ...
每天一个linux命令--awk
统计计算日志 pmail@app2linux04 performance]$ grep 'user:logBehaviorAction' performance.log|awk -F '|' '{pr ...
如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等
http://blog.chinaunix.net/uid-20662820-id-4023733.html http://www.faqs.org/faqs/snmp-faq/part2/ http ...

随机推荐

深入HQL学习以及HQL和SQL的区别
HQL(Hibernate Query Language) 是面向对象的查询语言, 它和 SQL 查询语言有些相似. 在 Hibernate 提供的各种检索方式中, HQL 是使用最广的一种检索方式. ...
通过TZ来设置嵌入式ARM+Linux的时区
1.在/etc/profile或者/root/.profile(/home/username/.profile) 在其中加入: TZ=UTC-08:00 export TZ hwclock -s
全量日志 requestId
常量参数和系统参数 API 的请求者不可见,由网关在请求后端服务时添加上. 常量参数.比如您的后端需要接收一个常量,但是这个常量您不希望被您的客户看见,那么就设置一个常量参数,可以在 Header 或 ...
linux服务器自动切割日志
需求由于nginx的日志会不停地增大,所以需要我们自己去切割日志,方便管理,需要达到以下的效果: 按日期自动切割日志,最小单位是天. 当日志总量超过一定量时,自动直接清理日志,限定总量不能超过100 ...
librosa音频特征提取，python librosa库在centos上依赖llvm的问题？
win10下安装使用: https://blog.csdn.net/qq_39516859/article/details/80679718 https://blog.csdn.net/qq_3951 ...
cmd 运行jar文件
将java工程打成jar包,但第三方jar包并没有包含在包中,当在命令行中运行jar包时,出现类找不到的异常, 在网上看到解决办法是将第三方jar包放到JDK的扩展类文件夹中(%JAVA_HOME%/ ...
mysql监控优化（三）慢查询
顾名思义,慢查询日志中记录的是执行时间较长的query,也就是我们常说的slowquery,通过设--log-slow-queries[=file_name]来打开该功能并设置记录位置和文件名.慢查询 ...
20165324《Java程序设计》第二周
20165324 <Java程序设计>第2周学习总结教材学习内容总结本周学习内容如下: 基本数据类型整数类型:byte,shout,int,long. 字符类型:char. 浮点类型 ...
[转]linux shell 获取当前正在执行脚本的绝对路径
原文链接:http://sexywp.com/bash-how-to-get-the-basepath-of-current-running-script.htm 常见的一种误区,是使用 pwd 命令 ...
Hadoop RPC实例
本文发表于本人博客. 上次写了个hadoop伪分布环境搭建的笔记了,今天来说下hadoop分布式构建的基础RPC,这个RPC在提交Job任务的时候底层就是创建了RPC来实现远程过程调用服务端. 我们首 ...

Linux命令awk

Linux命令awk的更多相关文章

随机推荐

热门专题