awk进阶

整理的awk的小技巧

begin是要放在正则前面的，按照这个顺序：

awk 'begin{} /.*?/ {action}end{}' file

FS=':' 和 -F: 是等同的

-F 表示以 XX为分隔符，那如果想要多个分隔呢？看实例：

$ cat tmp

ss>asdasd>hehe>asd

where are you are my

where are> you> are my

$ awk -F '(>|are)' '{print $3}' tmp

hehe

 my

 you

可以看到，这里的分隔符是 > 或者是 are ，通过第3个例子可以发现，只要句子中出现这两个词，都会作为分隔，所以才出现了you 。

for循环和便利数组，

for(i=;i<;i++)print i,ENVIRON[i]

或者

 for(i in ARGV){print i,ARGV[i]}

匹配正则表达式

if(a ~ /^*/)

不匹配

if(a ~! /^*/)

多文件操作，重点学习一下：

dahu@dahu-OptiPlex-:~/myfile$ awk 'FNR==1{print "\r\n"FILENAME}{print $0}' a.txt b.txt

a.txt
100 wang man
200 wangsan woman
300 wangming man
400 wangzheng man

b.txt
100 90 80
200 80 70
300 60 50
400 70 20

看下回显信息，FNR==1相当于一个条件用法，在第一行显示文件名，这个用法可以。类似的，我可以第二行/第三行显示

dahu@dahu-OptiPlex-3046:~/myfile$ awk 'BEGIN{info="it is a test";tlen=split(info,a," ");for(i in a){print tlen,i"\t"a[i]};}'

这句话tlen=split(info,a," "),tlen=4,因为分割成4个部分了，类似于len的用法

dahu@dahu-OptiPlex-3046:~/myfile$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";delete tB["a"];for(k in tB){print k,tB[k];}}'

删除数组键值的方法，直接delete

二维数组的用法：

awk 'BEGIN{print">>>>>";

for(i=;i<=;i++)

{

  for(j=;j<=;j++)

  {

tarr[i,j]=i*j;

  }

}

for(m in tarr)

{

split(m,tarr2,SUBSEP); 　　　　　　　　　　　　#split(数据源，新的数组，分割符)

print tarr2[],"*",tarr2[],"=",tarr[m];　　 #二维数组从刚生成的新数组里面获取

}

}'

显示文件的内容按照排序来显示

dahu@dahu-OptiPlex-:~/myfile$ cat b.txt | sort -nk3

两文件合并，借助next实现

[chengmo@centos5 shell]$  cat a.txt b.txt | sort -n -k1 |awk  'NR%2==1{fd1=$2"\t"$3;next}{print $0"\t"fd1}'

也可以直接编程来实现：

awk '

BEGIN{print ">>>>>\nconnect a.txt & b.txt";

if(ARGC<)

{

  exit ;

}

file="";

}

{

aData[FILENAME,$]=ARGV[]==FILENAME?$:$"\t"$;  　　  #条件判断式，要么整行，要么第二行第三行，和文件名对应

}

END{

for(k in aData)

{

    split(k,idx,SUBSEP);  　　　　　　　　　　　　　　　　　　#idx是aData的下标,k就是FILENAME和idx[]

    if (idx[]==ARGV[] && (ARGV[],idx[])in aData)

    {

        print aData[ARGV[],idx[]],aData[ARGV[],idx[]] | "sort -nrk1" 　　#这里要加上引号的？？

    }

}

}' a.txt b.txt

awk正则表达式

awk内置使用正则表达式函数

gsub( Ere, Repl, [ In ] )

sub( Ere, Repl, [ In ] )

match( String, Ere )

split( String, A, [Ere] )

EPRs类型。一些结合类型表示符没有了：包括：”\d,\D,\s,\S,\t,\v,\n,\f,\r”

常用： /[0-9]+/

常用内置函数

gsub,sub使用　　sub是只替换第一个，gsub是全部替换，函数返回值是替换的个数

[chengmo@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";gsub(/[0-9]+/,"!",info);print info}'

this is a test!test!

在 info中查找满足正则表达式，/[-]+/ 用””替换，并且替换后的值，赋值给info 未给info值，默认是$

查找字符串（index使用）

[wangsl@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";print index(info,"test")?"ok":"no found";}'

ok

未找到，返回0

正则表达式匹配查找(match使用）

[wangsl@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";print match(info,/[0-9]+/)?"ok":"no found";}'

ok

截取字符串(substr使用）

[wangsl@centos5 ~]$ awk 'BEGIN{info="this is a test2010test!";print substr(info,4,10);}'

s is a tes

从第 4个 字符开始，截取10个长度字符串

字符串分割（split使用）

[chengmo@centos5 ~]$ awk 'BEGIN{info="this is a test";split(info,tA," ");print length(tA);for(k in tA){print k,tA[k];}}'

 test

 this

 is

 a

分割info,动态创建数组tA,这里比较有意思，awk for …in 循环，是一个无序的循环。 并不是从数组下标1…n ，因此使用时候需要注意。

getline：awk里，从文件中读取变量到awk中

dahu@dahu-OptiPlex-:~/myfile$ awk 'BEGIN{while("cat car"|getline){print $1;};close("/car")}'

或者

dahu@dahu-OptiPlex-:~/myfile$ awk 'BEGIN{while(getline < "car"){print $1;};close("car")}'

这样就可以实现获取本地文件的功能了

同样的，也可以在脚本里面讲数据写入文件：

awk 'BEGIN{print "hehe"}' > hehe.txt

简单快速数字转汉字：

$ awk 'BEGIN{ORS="";a="零一二三四五六七八九";for(i=0;i<10;i++){arr[i]=substr(a,i+1,1)};b=345;for(j=1;j<=length(b);j++)
{c=substr(b,j,1);print arr[c]};print "\n"  }'

三四五

也可以处理文件

$ awk 'BEGIN{ORS="";a="零一二三四五六七八九";for(i=0;i<10;i++){arr[i]=substr(a,i+1,1)}}

{for(j=;j<=length($);j++){c=substr($,j,);print arr[c]};print "\n"  }'  text

一三四

一三五

一三六

一三七

awk进阶的更多相关文章

第10章：awk进阶操作
第10章:awk进阶操作在第4章:查找与替换简单的讲解了awk的使用,本章介绍详细讲解awk的使用.awk是一个强大的文本分析工具,简单的说awk就是把文件逐行的读入, 以空格为默认分隔符将每行切片 ...
linux awk进阶篇
上一篇主要是awk的进本应用.本节是awk的进阶篇 ACTION:除去常用的print和printf还有以下几个 expression:表达式如$1>3 control statements: ...
awk进阶整理
BEGIN{写在前言,我英语不好,有许多地方直接使用的谷歌翻译.为了能理清awk工具使用的思路,详情还要看awk说明书(man awk) 或者http://www.gnu.org/software/g ...
LeetCode（194.Transpose File）(awk进阶)
194. Transpose File Given a text file file.txt, transpose its content. You may assume that each row ...
awk 进阶，百万行文件取交集
今天我们说的不是简单的交集,而是如下示例: file1: as,er,gf,1212kl,iop,121378,jkl,uio,jki,1214vbnm,yuoi,678i,1215sadfasdf, ...
shell编程awk进阶
awk操作符算术操作符: x+y, x-y, x*y, x/y, x^y, x%y -x: 转换为负数 +x: 转换为数值字符串操作符:没有符号的操作符,字符串连接赋值操作 ...
Linux三剑客之awk精讲（基础与进阶）
第1章 awk基础入门要弄懂awk程序,必须熟悉了解这个工具的规则.本实战笔记的目的是通过实际案例或面试题带同学们熟练掌握awk在企业中的用法,而不是awk程序的帮助手册. 1.1 awk简介一种 ...
【Linux进阶】使用grep、find、sed以及awk进行文本操作
目录一.元字符二.grep命令 1. 过滤出包含某字符串的行 2. 过滤出以某字符串开头(结尾)的行 3. 过滤出包含某字符串及其相邻的行 4. 过滤出不包含某关键字的行 5. 过滤出包含多个字符 ...
Linux实战教学笔记18:linux三剑客之awk精讲
Linux三剑客之awk精讲(基础与进阶) 标签(空格分隔): Linux实战教学笔记-陈思齐快捷跳转目录: * 第1章:awk基础入门 * 1.1:awk简介 * 1.2:学完awk你可以掌握: ...

随机推荐

jquery动态添加的元素绑定的事件不生效的问题
我们可以通过 $(document).on('click', '#xxx', callback) 这种形式解决. 原因,一般情况下,我们是通过 $('#xxx').click(callback) 这种 ...
P4752 Divided Prime
P4752 Divided Prime 题目描述给定一个数字 AA ,这个 AA 由 a_1,a_2,\cdots,a_Na 1 ,a 2 ,⋯,a N 相乘得到. 给定一个数字 BB ...
Creating a Cron Job in K8S
Creating a Cron Job Cron jobs require a config file. This example cron job config .spec file prints ...
Node + vue 实现移动官网
简介使用 Node + vue 对公司的官网进行了一个简单的移动端的实现. 源码 https://github.com/wx1993/node-vue-fabaocn 效果组件轮播图(使用 vu ...
Asp.Net MVC +EF CodeFirst+多层程序设计
1.概述这是一个基于个人博客的一个项目,虽然博客根本没必要做这么复杂的设计.但是公司有需求,所以先自己弄个项目练练手.项目需要满足下列需求 1.层与层之间需要解耦,在后期上线更新维护时不需要覆盖,只 ...
centos7 nginx开启启动
centos 7以上是用Systemd进行系统初始化的,Systemd 是 Linux 系统中最新的初始化系统(init),它主要的设计目标是克服 sysvinit 固有的缺点,提高系统的启动速度.关 ...
有向图博弈+出度的结合 Codeforces Round #406 (Div. 2) C
http://codeforces.com/contest/787/problem/C 题目大意:有一个长度为n的环,第1个位置是黑洞,其他都是星球.已知在星球上(不含第一个黑洞)有一位神.有两个人, ...
利用ChainMap进行多字典合并
aa = [{105199: 'https://picx0.jpeg'}, {105187: 'https://picx1.jpeg'}, {105170: 'https:picx2.jpeg'}, ...
Spring REST 异常处理
在上一篇中写到了Spring MVC的异常处理,SpringMVC捕获到异常之后会转到相应的错误页面,但是我们REST API ,一般只返回结果和状态码,比如发生异常,只向客户端返回一个500的状态码 ...
RabbitMQ使用简记
RabbitMQ是什么 MQ全称为Message Queue, 即消息队列.MQ是一种应用程序对应用程序的通信方法.应用程序通过读写出入队列的消息(针对应用程序的数据)来通信,而无需专用连接来链接它们 ...

awk进阶

简单快速数字转汉字：

awk进阶的更多相关文章

随机推荐

热门专题