用awk写递归
版权申明:本文为博主窗户(Colin Cai)原创,欢迎转帖。如要转贴,必须注明原文网址 http://www.cnblogs.com/Colin-Cai/p/7087128.html 作者:窗户 QQ:6679072 E-mail:6679072@qq.com
看到自己很多年前写的一篇帖子,觉得有些意义,转录过来,稍加修改。
awk是一种脚本语言,语法接近C语言,我比较喜欢用,gawk甚至可以支持tcp/ip,用起来非常方便。
awk也支持递归,只是awk不支持局部变量,所有的变量都是全局的,于是写递归有些麻烦。本文说白了,也只是借awk说一种编程的思路罢了。
原文如下:
awk支持函数,也支持递归。但awk并不支持局部变量,于是看上去递归函数很不好实现,因为在某一级调用函数的时候,里面的变量在该级调用还没有退出前就可能会被别的调用给修改掉,于是得到的结果会与期望并不一致。
我们考虑C语言,它的局部变量放在硬件支持的栈(一般用栈指针)内。于是我们就去思考,为什么是栈呢?我们来考虑一个具体的函数调用顺序:
f1调用f2;
f2调用f3;
f3返回;
f2调用f4;
f4调用f5;
f5返回;
f4返回;
f2返回;
f1返回;
按照这个循序,我们来思考每个函数开辟的栈空间:
f1的栈空间开辟(f1进栈)
f2的栈空间开辟(f2进栈)
f3的栈空间开辟(f3进栈)
f3的栈空间消亡(f3出栈)
f4的栈空间开辟(f4进栈)
f5的栈空间开辟(f5进栈)
f5的栈空间消亡(f5出栈)
f4的栈空间消亡(f4出栈)
f2的栈空间消亡(f2出栈)
f1的栈空间消亡(f1出栈)
原来跟我们数据结构里的栈的先进后出是一回事情,所以叫栈。
而当前的我们取的变量的地址都是相对于栈指针来说的,这是相对,而不是像全局变量的那种绝对。
于是我们可以受到启发,可以扩展这里的栈指针和地址的概念,awk的递归函数就可以出来了。
以下是用递归来算一个数组中的最大值(每递归一级就把数组分为两段,每段求最大值),只是举一个例子,可以扩展到任意应用。
#!/bin/awk -f
func test1(a,start,len)
{
if(len<=1)
return a[start];
x = test1(a,start,int(len/2));
y = test1(a,start+int(len/2),len-int(len/2));
return (x>y)?x:y;
}
func test2(a,start,len)
{
if(len<=1)
return a[start];
testlen++;
testa[testlen] = test2(a,start,int(len/2));
testlen++;
testa[testlen] = test2(a,start+int(len/2),len-int(len/2));
testlen-=2;
return (testa[testlen+1]>testa[testlen+2])?testa[testlen+1]:testa[testlen+2];
}
func test3(a,start,len)
{
if(len<=1) {
return a[start];
}
V = V";"test3(a,start,int(len/2));
V = V";"test3(a,start+int(len/2),len-int(len/2));
xx = V;
sub(/.*;/,"",xx);
sub(/;[^;]+$/,"",V);
yy = V;
sub(/.*;/,"",yy);
sub(/;[^;]+$/,"",V);
return int(xx)>int(yy)?int(xx):int(yy);
}
NR==1{
way=$1;
print $1
}
NR==2{
max=$1;
for(i=2;i<=NF;i++)
if($i > max)
max = $i;
print max;
for(i=1;i<=NF;i++)
a[i] = $i;
if(way == 2)
print test2(a,1,NF);
else if(way == 3)
print test3(a,1,NF);
else
print test1(a,1,NF);
exit(0);
}
这里面实现了三个递归函数,第一个是测试全局变量的污染,它是得不到正确的答案的
第二个是用数组来模拟变量栈,testlen就是所谓的“栈顶指针”
第三个是用字符串来模拟变量栈,字符串末尾就是“栈顶指针”,每个“局部变量”之间是用分号隔开
用随机数据测试一下这个应用:
linux-0gt0:/tmp/test # for((i=0;i<10;i++));do { echo $(($RANDOM % 3 + 1)); let count=$RANDOM%100+50; for((j=0;j<count;j++));do echo -n $(($RANDOM % 10000)) " "; done ; echo ; }|./1.awk ;done | sed -nr 'N;N;p;/\n(.*)\n\1$/{s/.*/right\n/p;d;}; /^[23]/s/(.).*/\1 SO STRANGE!!!!!!!!!!!!!!!!!!!!!/p; s/.*/wrong\n/p'
2
9981
9981
right 3
9391
9391
right 1
9919
5257
wrong 2
9860
9860
right 3
9967
9967
right 3
9940
9940
right 3
9828
9828
right 2
9752
9752
right 3
9996
9996
right 2
9930
9930
right
当然,栈的数目自然也可以不只维系一个,test2和test3维系的是一个栈。
现在来实现test4和test5,两个函数是test2和test3的变体,各自维系两个栈。
#!/bin/awk -f
#func test1(a,start,len)
#{
# if(len<=1)
# return a[start];
# x = test1(a,start,int(len/2));
# y = test1(a,start+int(len/2),len-int(len/2));
# return (x>y)?x:y;
#}
func test2(a,start,len)
{
if(len<=1)
return a[start];
testlen++;
testa[testlen] = test2(a,start,int(len/2));
testlen++;
testa[testlen] = test2(a,start+int(len/2),len-int(len/2));
testlen-=2;
return (testa[testlen+1]>testa[testlen+2])?testa[testlen+1]:testa[testlen+2];
}
func test3(a,start,len)
{
if(len<=1) {
return a[start];
}
V = V";"test3(a,start,int(len/2));
V = V";"test3(a,start+int(len/2),len-int(len/2));
xx = V;
sub(/.*;/,"",xx);
sub(/;[^;]+$/,"",V);
yy = V;
sub(/.*;/,"",yy);
sub(/;[^;]+$/,"",V);
return int(xx)>int(yy)?int(xx):int(yy);
}
func test4(a,start,len)
{
if(len<=1)
return a[start];
testlenx++;
testleny++;
testax[testlenx] = test4(a,start,int(len/2));
testay[testleny] = test4(a,start+int(len/2),len-int(len/2));
testlenx-=1;
testleny-=1;
return (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];
}
func test5(a,start,len)
{
if(len<=1) {
return a[start];
}
V1 = V1";"test5(a,start,int(len/2));
V2 = V2";"test5(a,start+int(len/2),len-int(len/2));
xx = V1;
sub(/.*;/,"",xx);
sub(/;[^;]+$/,"",V1);
yy = V2;
sub(/.*;/,"",yy);
sub(/;[^;]+$/,"",V2);
return int(xx)>int(yy)?int(xx):int(yy);
}
NR==1{
way=$1;
print $1
}
NR==2{
max=$1;
for(i=2;i<=NF;i++)
if($i > max)
max = $i;
print max;
for(i=1;i<=NF;i++)
a[i] = $i;
if(way == 2)
print test2(a,1,NF);
else if(way == 3)
print test3(a,1,NF);
else if(way == 4)
print test4(a,1,NF);
else if(way == 5)
print test5(a,1,NF);
exit(0);
}
测试一下,
linux-0gt0:/tmp/test # for((i=0;i<10;i++));do { echo $(($RANDOM % 2 + 4)); let count=$RANDOM%100+50; for((j=0;j<count;j++));do echo -n $(($RANDOM % 10000)) " "; done ; echo ; }|./1.awk ;done | sed -nr 'N;N;p;/\n(.*)\n\1$/{s/.*/right\n/p;d;}; /^[234]/s/(.).*/\1 SO STRANGE!!!!!!!!!!!!!!!!!!!!!/p; s/.*/wrong\n/p'
5
9904
9904
right 4
9823
9823
right 5
9975
9975
right 4
9966
9966
right 5
9683
9683
right 5
9981
9981
right 4
9983
9983
right 5
9966
9966
right 5
9967
9967
right 5
9870
9870
right
当然,test4和test5各自维系的两个栈其实差别和一个栈不大,因为两个栈是同时进栈同时出栈的。
其实,即使两个栈并非同时进出栈也是可以的,只是对于这里的例子来说写不出这么复杂。
实际上,任意多的栈,任意进出栈,都是可以的。
这样就可以做到更加灵活的应用。
软件的扩展性比硬件强,我想,这就是软件的用处吧。
还是这个取最大值,举个含有多个栈,每个栈入出并不完全一致的例子,这里的test6函数
#!/bin/awk -f
func test1(a,start,len)
{
if(len<=1)
return a[start];
x = test1(a,start,int(len/2));
y = test1(a,start+int(len/2),len-int(len/2));
return (x>y)?x:y;
}
func test2(a,start,len)
{
if(len<=1)
return a[start];
testlen++;
testa[testlen] = test2(a,start,int(len/2));
testlen++;
testa[testlen] = test2(a,start+int(len/2),len-int(len/2));
testlen-=2;
return (testa[testlen+1]>testa[testlen+2])?testa[testlen+1]:testa[testlen+2];
}
func test3(a,start,len)
{
if(len<=1) {
return a[start];
}
V = V";"test3(a,start,int(len/2));
V = V";"test3(a,start+int(len/2),len-int(len/2));
xx = V;
sub(/.*;/,"",xx);
sub(/;[^;]+$/,"",V);
yy = V;
sub(/.*;/,"",yy);
sub(/;[^;]+$/,"",V);
return int(xx)>int(yy)?int(xx):int(yy);
}
func test4(a,start,len)
{
if(len<=1)
return a[start];
testlenx++;
testleny++;
testax[testlenx] = test4(a,start,int(len/2));
testay[testleny] = test4(a,start+int(len/2),len-int(len/2));
testlenx-=1;
testleny-=1;
return (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];
}
func test5(a,start,len)
{
if(len<=1) {
return a[start];
}
V1 = V1";"test5(a,start,int(len/2));
V2 = V2";"test5(a,start+int(len/2),len-int(len/2));
xx = V1;
sub(/.*;/,"",xx);
sub(/;[^;]+$/,"",V1);
yy = V2;
sub(/.*;/,"",yy);
sub(/;[^;]+$/,"",V2);
return int(xx)>int(yy)?int(xx):int(yy);
}
func test6(a,start,len)
{
if(len <= 1) {
return a[start];
} else if(len == 2) {
return (a[start]>a[start+1])?a[start]:a[start+1];
} else if(len == 3) {
var1 = (a[start]>a[start+1])?a[start]:a[start+1];
return (var1>a[start+2])?var1:a[start+2];
}
var2 = int(rand()*10000)%3+2;
if(var2 == 2) {
testlenx++;
testleny++;
testax[testlenx] = test6(a,start,int(len/2));
testay[testleny] = test6(a,start+int(len/2),len-int(len/2));
testlenx-=1;
testleny-=1;
return (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];
} else if(var2 == 3) {
testlenx++;
testleny++;
testlenz++;
testax[testlenx] = test6(a,start,int(len/3));
testay[testleny] = test6(a,start+int(len/3),int(len/3));
testaz[testlenz] = test6(a,start+2*int(len/3),len-2*int(len/3));
testlenx-=1;
testleny-=1;
testlenz-=1;
var1 = (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];
return ((var1>testaz[testlenz+1])?var1:testaz[testlenz+1]);
} else if(var2 == 4) {
testlenx++;
testleny++;
testlenz++;
testlenA++;
testax[testlenx] = test6(a,start,int(len/4));
testay[testleny] = test6(a,start+int(len/4),int(len/4));
testaz[testlenz] = test6(a,start+2*int(len/4),int(len/4));
testaA[testlenA] = test6(a,start+3*int(len/4),len-3*int(len/4));
testlenx-=1;
testleny-=1;
testlenz-=1;
testlenA-=1;
var1 = (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];
var4 = (testaz[testlenz+1]>testaA[testlenA+1])?testaz[testlenz+1]:testaA[testlenA+1];
return ((var1>var4)?var1:var4);
}
}
BEGIN {
srand(systime());
}
NR==1{
way=$1;
print $1
}
NR==2{
max=$1;
for(i=2;i<=NF;i++)
if($i > max)
max = $i;
print max;
for(i=1;i<=NF;i++)
a[i] = $i;
if(way == 2)
print test2(a,1,NF);
else if(way == 3)
print test3(a,1,NF);
else if(way == 4)
print test4(a,1,NF);
else if(way == 5)
print test5(a,1,NF);
else if(way == 6)
print test6(a,1,NF);
else
print test1(a,1,NF);
exit(0);
}
用awk写递归的更多相关文章
- awk的递归
想来惭愧,之前写的一篇文章<用awk写递归>里多少是传递里错误的信息.虽然那篇文章目的上是为了给出一种思路,但实际上awk是可以支持函数局部变量的. awk对于局部变量的支持比起大多数过程 ...
- iOS:Block写递归
首先来一个 oc 的递归: - (int)sum:(int)num { ) { return num; } ]; } 写递归算法只需要记住两点即可: 1. 有一个明确的出口 2. 不满足条件出口时,自 ...
- 分享一个的c++写的,模仿awk的框架类CAwkDoc
这是我好多年前,模仿awk写的. awk大家都比较熟悉,使用awk处理文件,读取文件,分割字段这些工作awk自己帮你实现了. 程序员只要编写业务逻辑代码,并且awk还提供了很多常用的字符串操作函数,可 ...
- awk 手册--【转载】
1. 前言 有关本手册 : 这是一本awk学习指引, 其重点着重于 : l awk 适于解决哪些问题 ? l awk 常见的解题模式为何 ? 为使读者快速掌握awk解 ...
- awk中文手册
1. 前言 有关本手册 : 这是一本awk学习指引, 其重点着重于 : l awk 适于解决哪些问题 ? l awk 常见的解题模式为何 ? 为使读者快速掌握awk解题的模 ...
- 见过的最好AWK手册
原文: http://linuxfire.com.cn/~lily/awk.html 简体中文版由bones7456 (http://li2z.cn)整理. 原文:应该是 http://phi.sin ...
- awk 手册
1. 前言 有关本手册 : 这是一本awk学习指引, 其重点着重于 : l awk 适于解决哪些问题 ? l awk 常见的解题模式为何 ? 为使读者快速掌握awk解题的模 ...
- [转]awk使用手册
awk 手册 简体中文版由bones7456 (bones7456@gmail.com)整理. 原文:应该是 http://phi.sinica.edu.tw/aspac/reports/94/940 ...
- awk手册
awk 手册 简体中文版由bones7456 (bones7456@gmail.com)整理. 原文:应该是 http://phi.sinica.edu.tw/aspac/reports/94/940 ...
随机推荐
- python3 time模块与datetime模块
time模块 在Python中,通常有这几种方式来表示时间:1)时间戳 2)格式化的时间字符串 3)元组(struct_time)共九个元素.由于Python的time模块实现主要调用C库,所以各个平 ...
- JavaScript ,Python,java,Go系列算法之选择排序
常见的内部排序算法有:插入排序.希尔排序.选择排序.冒泡排序.归并排序.快速排序.堆排序.基数排序等. 用一张图概括: 选择排序 选择排序是一种简单直观的排序算法,无论什么数据进去都是O(n2) ...
- Appium 1.6.4 环境搭建流程(Java, Android+IOS, Windows+Mac)
Appium1.6.4已经出来一段时间了,快速给大家串一下怎么搭建,贴了下载链接 1 基础环境: Windows + Mac: Java JDK 1.8+ (需配置环境变量),Appium1.6.4的 ...
- 新鲜小玩意儿- deviceOrientation移动设备旋转事件
<javascript高级程序设计>第三版 其中事件的章节 提到一个有意思的事件 deviceOrientation 也就是 设备(device) - orientation(方向) 贴代 ...
- event对应的各种坐标
IE8不支持的PageXY 相对于整个页面鼠标的位置 包括溢出的部分 event.pageX; event.pageY; 所有浏览器支持的: 相对于当前浏览器窗口可视区域的坐标event.clie ...
- iOS Regex匹配关键字并修改颜色
引入第三方框架RegexKitLite /** * 根据传入的文字返回一个符合规则的富文本 * * @param title 匹配的文字 * * @return 创建的富文本 */ -(NSAttri ...
- OpenCV探索之路(十五):角点检测
角点检测是计算机视觉系统中用来获取图像特征的一种方法.我们都常说,这幅图像很有特点,但是一问他到底有哪些特点,或者这幅图有哪些特征可以让你一下子就识别出该物体,你可能就说不出来了.其实说图像的特征,你 ...
- zabbix监控Elasticsearch集群
本节以 zabbix 为例,介绍如何使用监控系统完成 Elasticsearch 的监控报警. github 上有好几个版本的 ESZabbix 仓库,都源自 Elastic 公司员工 unterge ...
- jQuery对象的创建(一)
在jQuery的常规用法中,执行"$()"返回的是一个jQuery对象,在源码中,它是这样定义的: ... var jQuery = function() { return new ...
- javascript获取json对象的key名称的两种方法
javascript获取json对象的key名称的两种方法 数据处理中,你可能接收到一个不确定内容格式的json对象,然后要把key的值提取出来.今天试过两种可以提取json key的方法,均可以正常 ...