用awk写递归

　　版权申明：本文为博主窗户(Colin Cai)原创，欢迎转帖。如要转贴，必须注明原文网址

　　http://www.cnblogs.com/Colin-Cai/p/7087128.html 

　　作者：窗户

　　QQ：6679072

　　E-mail：6679072@qq.com

看到自己很多年前写的一篇帖子，觉得有些意义，转录过来，稍加修改。

awk是一种脚本语言，语法接近C语言，我比较喜欢用，gawk甚至可以支持tcp/ip,用起来非常方便。

awk也支持递归，只是awk不支持局部变量，所有的变量都是全局的，于是写递归有些麻烦。本文说白了，也只是借awk说一种编程的思路罢了。

原文如下：

awk支持函数，也支持递归。但awk并不支持局部变量，于是看上去递归函数很不好实现，因为在某一级调用函数的时候，里面的变量在该级调用还没有退出前就可能会被别的调用给修改掉，于是得到的结果会与期望并不一致。
我们考虑C语言，它的局部变量放在硬件支持的栈（一般用栈指针）内。于是我们就去思考，为什么是栈呢？我们来考虑一个具体的函数调用顺序：
f1调用f2;
f2调用f3;
f3返回；
f2调用f4;
f4调用f5;
f5返回；
f4返回；
f2返回；
f1返回；
按照这个循序，我们来思考每个函数开辟的栈空间：
f1的栈空间开辟(f1进栈）
f2的栈空间开辟(f2进栈）
f3的栈空间开辟(f3进栈）
f3的栈空间消亡(f3出栈）
f4的栈空间开辟(f4进栈）
f5的栈空间开辟(f5进栈）
f5的栈空间消亡(f5出栈）
f4的栈空间消亡(f4出栈）
f2的栈空间消亡(f2出栈）
f1的栈空间消亡(f1出栈）
原来跟我们数据结构里的栈的先进后出是一回事情，所以叫栈。
而当前的我们取的变量的地址都是相对于栈指针来说的，这是相对，而不是像全局变量的那种绝对。
于是我们可以受到启发，可以扩展这里的栈指针和地址的概念，awk的递归函数就可以出来了。
以下是用递归来算一个数组中的最大值（每递归一级就把数组分为两段，每段求最大值），只是举一个例子，可以扩展到任意应用。

#!/bin/awk -f

func test1(a,start,len)

{

        if(len<=1)

                return a[start];

        x = test1(a,start,int(len/2));

        y = test1(a,start+int(len/2),len-int(len/2));

        return (x>y)?x:y;

}

func test2(a,start,len)

{

        if(len<=1)

                return a[start];

        testlen++;

        testa[testlen] = test2(a,start,int(len/2));

        testlen++;

        testa[testlen] = test2(a,start+int(len/2),len-int(len/2));

        testlen-=2;

        return (testa[testlen+1]>testa[testlen+2])?testa[testlen+1]:testa[testlen+2];

}

func test3(a,start,len)

{

        if(len<=1) {

                return a[start];

        }

        V = V";"test3(a,start,int(len/2));

        V = V";"test3(a,start+int(len/2),len-int(len/2));

        xx = V;

        sub(/.*;/,"",xx);

        sub(/;[^;]+$/,"",V);

        yy = V;

        sub(/.*;/,"",yy);

        sub(/;[^;]+$/,"",V);

        return int(xx)>int(yy)?int(xx):int(yy);

}

NR==1{

        way=$1;

        print $1

}

NR==2{

        max=$1;

        for(i=2;i<=NF;i++)

                if($i > max)

                        max = $i;

        print max;

        for(i=1;i<=NF;i++)

                a[i] = $i;

        if(way == 2)

                print test2(a,1,NF);

        else if(way == 3)

                print test3(a,1,NF);

        else

                print test1(a,1,NF);

        exit(0);

}

这里面实现了三个递归函数，第一个是测试全局变量的污染，它是得不到正确的答案的
第二个是用数组来模拟变量栈，testlen就是所谓的“栈顶指针”
第三个是用字符串来模拟变量栈，字符串末尾就是“栈顶指针”，每个“局部变量”之间是用分号隔开
用随机数据测试一下这个应用：

linux-0gt0:/tmp/test # for((i=0;i<10;i++));do  { echo $(($RANDOM % 3 + 1)); let count=$RANDOM%100+50; for((j=0;j<count;j++));do echo -n $(($RANDOM % 10000)) " "; done ; echo ; }|./1.awk ;done | sed -nr 'N;N;p;/\n(.*)\n\1$/{s/.*/right\n/p;d;};       /^[23]/s/(.).*/\1 SO STRANGE!!!!!!!!!!!!!!!!!!!!!/p; s/.*/wrong\n/p'

2

9981

9981

right

3

9391

9391

right

1

9919

5257

wrong

2

9860

9860

right

3

9967

9967

right

3

9940

9940

right

3

9828

9828

right

2

9752

9752

right

3

9996

9996

right

2

9930

9930

right

当然，栈的数目自然也可以不只维系一个，test2和test3维系的是一个栈。
现在来实现test4和test5，两个函数是test2和test3的变体，各自维系两个栈。

#!/bin/awk -f

#func test1(a,start,len)

#{

#       if(len<=1)

#               return a[start];

#       x = test1(a,start,int(len/2));

#       y = test1(a,start+int(len/2),len-int(len/2));

#       return (x>y)?x:y;

#}

func test2(a,start,len)

{

        if(len<=1)

                return a[start];

        testlen++;

        testa[testlen] = test2(a,start,int(len/2));

        testlen++;

        testa[testlen] = test2(a,start+int(len/2),len-int(len/2));

        testlen-=2;

        return (testa[testlen+1]>testa[testlen+2])?testa[testlen+1]:testa[testlen+2];

}

func test3(a,start,len)

{

        if(len<=1) {

                return a[start];

        }

        V = V";"test3(a,start,int(len/2));

        V = V";"test3(a,start+int(len/2),len-int(len/2));

        xx = V;

        sub(/.*;/,"",xx);

        sub(/;[^;]+$/,"",V);

        yy = V;

        sub(/.*;/,"",yy);

        sub(/;[^;]+$/,"",V);

        return int(xx)>int(yy)?int(xx):int(yy);

}

func test4(a,start,len)

{

        if(len<=1)

                return a[start];

        testlenx++;

        testleny++;

        testax[testlenx] = test4(a,start,int(len/2));

        testay[testleny] = test4(a,start+int(len/2),len-int(len/2));

        testlenx-=1;

        testleny-=1;

        return (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];

}

func test5(a,start,len)

{

        if(len<=1) {

                return a[start];

        }

        V1 = V1";"test5(a,start,int(len/2));

        V2 = V2";"test5(a,start+int(len/2),len-int(len/2));

        xx = V1;

        sub(/.*;/,"",xx);

        sub(/;[^;]+$/,"",V1);

        yy = V2;

        sub(/.*;/,"",yy);

        sub(/;[^;]+$/,"",V2);

        return int(xx)>int(yy)?int(xx):int(yy);

}

NR==1{

        way=$1;

        print $1

}

NR==2{

        max=$1;

        for(i=2;i<=NF;i++)

                if($i > max)

                        max = $i;

        print max;

        for(i=1;i<=NF;i++)

                a[i] = $i;

        if(way == 2)

                print test2(a,1,NF);

        else if(way == 3)

                print test3(a,1,NF);

        else if(way == 4)

                print test4(a,1,NF);

        else if(way == 5)

                print test5(a,1,NF);

        exit(0);

}

测试一下，

linux-0gt0:/tmp/test # for((i=0;i<10;i++));do  { echo $(($RANDOM % 2 + 4)); let count=$RANDOM%100+50; for((j=0;j<count;j++));do echo -n $(($RANDOM % 10000)) " "; done ; echo ; }|./1.awk ;done | sed -nr 'N;N;p;/\n(.*)\n\1$/{s/.*/right\n/p;d;};       /^[234]/s/(.).*/\1 SO STRANGE!!!!!!!!!!!!!!!!!!!!!/p; s/.*/wrong\n/p'

5

9904

9904

right

4

9823

9823

right

5

9975

9975

right

4

9966

9966

right

5

9683

9683

right

5

9981

9981

right

4

9983

9983

right

5

9966

9966

right

5

9967

9967

right

5

9870

9870

right

当然，test4和test5各自维系的两个栈其实差别和一个栈不大，因为两个栈是同时进栈同时出栈的。
其实，即使两个栈并非同时进出栈也是可以的，只是对于这里的例子来说写不出这么复杂。
实际上，任意多的栈，任意进出栈，都是可以的。
这样就可以做到更加灵活的应用。
软件的扩展性比硬件强，我想，这就是软件的用处吧。

还是这个取最大值,举个含有多个栈,每个栈入出并不完全一致的例子,这里的test6函数

#!/bin/awk -f

func test1(a,start,len)

{

        if(len<=1)

                return a[start];

        x = test1(a,start,int(len/2));

        y = test1(a,start+int(len/2),len-int(len/2));

        return (x>y)?x:y;

}

func test2(a,start,len)

{

        if(len<=1)

                return a[start];

        testlen++;

        testa[testlen] = test2(a,start,int(len/2));

        testlen++;

        testa[testlen] = test2(a,start+int(len/2),len-int(len/2));

        testlen-=2;

        return (testa[testlen+1]>testa[testlen+2])?testa[testlen+1]:testa[testlen+2];

}

func test3(a,start,len)

{

        if(len<=1) {

                return a[start];

        }

        V = V";"test3(a,start,int(len/2));

        V = V";"test3(a,start+int(len/2),len-int(len/2));

        xx = V;

        sub(/.*;/,"",xx);

        sub(/;[^;]+$/,"",V);

        yy = V;

        sub(/.*;/,"",yy);

        sub(/;[^;]+$/,"",V);

        return int(xx)>int(yy)?int(xx):int(yy);

}

func test4(a,start,len)

{

        if(len<=1)

                return a[start];

        testlenx++;

        testleny++;

        testax[testlenx] = test4(a,start,int(len/2));

        testay[testleny] = test4(a,start+int(len/2),len-int(len/2));

        testlenx-=1;

        testleny-=1;

        return (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];

}

func test5(a,start,len)

{

        if(len<=1) {

                return a[start];

        }

        V1 = V1";"test5(a,start,int(len/2));

        V2 = V2";"test5(a,start+int(len/2),len-int(len/2));

        xx = V1;

        sub(/.*;/,"",xx);

        sub(/;[^;]+$/,"",V1);

        yy = V2;

        sub(/.*;/,"",yy);

        sub(/;[^;]+$/,"",V2);

        return int(xx)>int(yy)?int(xx):int(yy);

}

func test6(a,start,len)

{

        if(len <= 1) {

                return a[start];

        } else if(len == 2) {

                return (a[start]>a[start+1])?a[start]:a[start+1];

        } else if(len == 3) {

                var1 = (a[start]>a[start+1])?a[start]:a[start+1];

                return (var1>a[start+2])?var1:a[start+2];

        }

        var2 = int(rand()*10000)%3+2;

        if(var2 == 2) {

                testlenx++;

                testleny++;

                testax[testlenx] = test6(a,start,int(len/2));

                testay[testleny] = test6(a,start+int(len/2),len-int(len/2));

                testlenx-=1;

                testleny-=1;

                return (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];

        } else if(var2 == 3) {

                testlenx++;

                testleny++;

                testlenz++;

                testax[testlenx] = test6(a,start,int(len/3));

                testay[testleny] = test6(a,start+int(len/3),int(len/3));

                testaz[testlenz] = test6(a,start+2*int(len/3),len-2*int(len/3));

                testlenx-=1;

                testleny-=1;

                testlenz-=1;

                var1 = (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];

                return ((var1>testaz[testlenz+1])?var1:testaz[testlenz+1]);

        } else if(var2 == 4) {

                testlenx++;

                testleny++;

                testlenz++;

                testlenA++;

                testax[testlenx] = test6(a,start,int(len/4));

                testay[testleny] = test6(a,start+int(len/4),int(len/4));

                testaz[testlenz] = test6(a,start+2*int(len/4),int(len/4));

                testaA[testlenA] = test6(a,start+3*int(len/4),len-3*int(len/4));

                testlenx-=1;

                testleny-=1;

                testlenz-=1;

                testlenA-=1;

                var1 = (testax[testlenx+1]>testay[testleny+1])?testax[testlenx+1]:testay[testleny+1];

                var4 = (testaz[testlenz+1]>testaA[testlenA+1])?testaz[testlenz+1]:testaA[testlenA+1];

                return ((var1>var4)?var1:var4);

        }

}

BEGIN {

        srand(systime());

}

NR==1{

        way=$1;

        print $1

}

NR==2{

        max=$1;

        for(i=2;i<=NF;i++)

                if($i > max)

                        max = $i;

        print max;

        for(i=1;i<=NF;i++)

                a[i] = $i;

        if(way == 2)

                print test2(a,1,NF);

        else if(way == 3)

                print test3(a,1,NF);

        else if(way == 4)

                print test4(a,1,NF);

        else if(way == 5)

                print test5(a,1,NF);

        else if(way == 6)

                print test6(a,1,NF);

        else

                print test1(a,1,NF);

        exit(0);

}

用awk写递归的更多相关文章

awk的递归
想来惭愧,之前写的一篇文章<用awk写递归>里多少是传递里错误的信息.虽然那篇文章目的上是为了给出一种思路,但实际上awk是可以支持函数局部变量的. awk对于局部变量的支持比起大多数过程 ...
iOS：Block写递归
首先来一个 oc 的递归: - (int)sum:(int)num { ) { return num; } ]; } 写递归算法只需要记住两点即可: 1. 有一个明确的出口 2. 不满足条件出口时,自 ...
分享一个的c++写的，模仿awk的框架类CAwkDoc
这是我好多年前,模仿awk写的. awk大家都比较熟悉,使用awk处理文件,读取文件,分割字段这些工作awk自己帮你实现了. 程序员只要编写业务逻辑代码,并且awk还提供了很多常用的字符串操作函数,可 ...
awk 手册--【转载】
1. 前言有关本手册 : 这是一本awk学习指引, 其重点着重于 : l awk 适于解决哪些问题 ? l awk 常见的解题模式为何 ? 为使读者快速掌握awk解 ...
awk中文手册
1. 前言有关本手册 : 这是一本awk学习指引, 其重点着重于 : l awk 适于解决哪些问题 ? l awk 常见的解题模式为何 ? 为使读者快速掌握awk解题的模 ...
见过的最好AWK手册
原文: http://linuxfire.com.cn/~lily/awk.html 简体中文版由bones7456 (http://li2z.cn)整理. 原文:应该是 http://phi.sin ...
awk 手册
1. 前言有关本手册 : 这是一本awk学习指引, 其重点着重于 : l awk 适于解决哪些问题 ? l awk 常见的解题模式为何 ? 为使读者快速掌握awk解题的模 ...
[转]awk使用手册
awk 手册简体中文版由bones7456 (bones7456@gmail.com)整理. 原文:应该是 http://phi.sinica.edu.tw/aspac/reports/94/940 ...
awk手册
awk 手册简体中文版由bones7456 (bones7456@gmail.com)整理. 原文:应该是 http://phi.sinica.edu.tw/aspac/reports/94/940 ...

随机推荐

java中的引用传递（同样适用于JS）
1 java中的数据类型: 有8种基本数据类型,分别为:byte(1),boolean(1),char(2),short(2),int(4),long(8),float(4),double(8) ...
在iOS应用程序中使用Frida绕过越狱检测
阿里聚安全在之前的三篇博客中介绍了利用Frida攻击Android应用程序,整个过程仿佛让开发者开启上帝视角,在本篇博客中,我们将会介绍在iOS应用程序中使用Frida绕过越狱检测.即使 ...
直接用nose进行django项目测试并输出html报告
先说需求:1.测试django项目:2.打印测试报告(html格式)有以下几种测试方法:1.django自带的测试模块.在app目录下的tests.py文件中写测试类,类似这样: class MyTe ...
hdu1372 Knight Moves BFS 搜索
简单BFS题目主要是读懂题意和中国的象棋中马的走法一样,走日字型,共八个方向我最初wa在初始化上了....以后多注意... 代码: #include <iostream> #incl ...
最近一些朋友问我，临近快毕业了专业不对口，想转行看到IT行业就业前景不错，但是编程语言众多不了解，不知道哪门语言能够快速入门掌握，短期能让我找到工作
我做互联网前端后台开发也有四年多了,一路走过来,累并快乐着.快乐比艰辛更多,源自我的兴趣驱动.初中的一个偶然的机会我接触到了计算机,从那个时候就喜欢上开始经常到网吧上网.那个时候我对计算机领域的认识是 ...
vue2入坑随记(一)
都说Vue2简单,上手容易,但小马过河,自己试了才晓得,除了ES6语法和webpack的配置让你感到陌生,重要的是思路的变换,以前随便拿全局变量和修改dom的锤子不能用了,变换到关注数据本身.vue的 ...
远程登录aws
AWS的EC2服务器是用密钥来认证的,在创建instance时,会提示,创建一个key pair,同时会提示下载一个xxx.pem的密钥文件到本地硬盘.下面是通过SecureCRT连接到EC2的操作步 ...
XSS研究1-来自外部的XSS攻击
引入: 上文中我们的例子是研究了来自内部的XSS攻击,通过输送一段有害js代码到受害者的机器,让其在受害者的域上运行这段有害JS代码来得到入侵目的.现在我们来看下来自外部的XSS攻击. 实践: 下面还 ...
Swift 入门之简单语法（一）
定义 let 定义常量,一经赋值不允许再修改 var 定义变量,赋值之后仍然可以修改 //: # 常量 //: 定义常量并且直接设置数值 let x = 20 //: 常量数值一经设置,不能修改,以下 ...
centos6.5 修改java环境变量
[root@m1 ~]# cat /etc/profile export JAVA_HOME=/usr/local/soft/jdkexport PATH=$JAVA_HOME/bin:$PATH e ...

用awk写递归

用awk写递归的更多相关文章

随机推荐

热门专题