泛函编程（7）－数据结构－List

折叠算法是List的典型算法。通过折叠算法可以实现众多函数组合（function composition）。所以折叠算法也是泛函编程里的基本组件（function combinator）。了解折叠算法的原理对了解泛函组合有着至关紧要的帮助。折叠算法又可分右折叠和左折叠。我们先从右折叠（foldRight）开始:

从以上两图示可以得出对List(a,b,c)的右折叠算法：op(a,op(b,op(c,z))) 可以看出括号是从右开始的。计算方式如图二：op(a,sub), sub是重复子树，可以肯定要用递归算法。这里z代表了一个起始值。我们现在可以推算出foldRight的函数款式（function signature）了:

       def foldRight[A,B](l: List[A], z: B)(op: (A,B) => B): B = l match {

           case Nil => z

           case Cons(h,t) => op(h,foldRight(t,z)(f))

       }

注意foldRight不是一个尾递归算法（tail recursive）。我们试着对一个List(1,2,3)进行操作，先来个加法：

 foldRight(List(1,2,3),0)((x,y) => x + y)          //> res13: Int = 6

 foldRight(List(1,2,3),0){_ + _}                   //> res14: Int = 6

我们可以用”等量替换“方法简约：

  // (List(x1,x2,x3...x{n-1}, xn) foldRight acc) op => x1 op (...(xn op acc)...)

  // foldRight(Cons(1,Cons(2,Cons(3,Nil))), 0) {_ + _}

  // 1 + foldRight(Cons(2,Cons(3,Nil)), 0) {_ + _}

  // 1 + (2 + foldRight(Cons(3,Nil), 0) {_ + _})

  // 1 + (2 + (3 + foldRight(Nil, 0) {_ + _}))

  // 1 + (2 + (3 + 0)) = 6

 foldRight(List(1,2,3),1){_ * _}                   //> res16: Int = 6

 foldRight(List(1,2,3),Nil:List[Int]) { (a,b) => Cons(a+10,b) }

                                                    //> res17: ch3.list.List[Int] = Cons(11,Cons(12,Cons(13,Nil)))

注意以上的起始值1和Nil:List[Int]。z的类型可以不是A，所以op的结果也有可能不是A类型，但在以上的加法和乘法的例子里z都是Int类型的。但在List重构例子里z是List[Int]类型，所以op的结果也是List[Int]类型的，这点要特别注意。

再来看看左折叠算法：

从以上图示分析，左折叠算法就是所有List元素对z的操作op。从图二可见，op对z,a操作后op的结果再作为z与b再进行op操作，如此循环。看来又是一个递归算法，而z就是一个用op累积的值了：op(op(op(z,a),b),c)。左折叠算法的括号是从左边开始的。来看看foldLeft的实现：

       def foldLeft[A,B](l: List[A], acc: B)(op: (B,A) => B): B = l match {

           case Nil => acc

           case Cons(h,t) => foldLeft(t,op(acc,h))(op)

       }

注意z (zero) 变成了 acc (accumulator），op: (B,A) = B, 和foldRight的op函数入参顺序是颠倒的。foldLeft是个尾递归方法。

 foldLeft(List(1,2,3),0)((b,a) => a + b)           //> res18: Int = 6

 foldLeft(List(1,2,3),0){_ + _}                    //> res19: Int = 6

 foldLeft(List(1,2,3),1)((b,a) => a * b)           //> res20: Int = 6

 foldLeft(List(1,2,3),1){_ * _}                    //> res21: Int = 6

 foldLeft(List(1,2,3),Nil:List[Int]) { (b,a) => Cons(a+10,b) }

                                                   //> res22: ch3.list.List[Int] = Cons(13,Cons(12,Cons(11,Nil)))

以上加法和乘法的累积值acc都是A类型，但注意List重构的acc是List[Int]类型的，这个时候op入参的位置就很重要了。再注意一下，foldLeft重构的List的元素排列是反向的Cons(13,Cons(12,Cons(11,Nil))。我们还是可以用“等量替换”方法进行简约：

 // (List(x1,x2,x3...x{n-1}, xn) foldLeft acc) op => (...(acc op x1) op x2)...) op x{n-1}) op xn

  // foldLeft(Cons(1,Cons(2,Cons(3,Nil))), 0) {_ + _}

  // foldLeft(Cons(2,Cons(3,Nil)), (0 + 1)) {_ + _}

  // foldLeft(Cons(3,Nil), ((0 + 1) + 2)) {_ + _}

  // foldLeft(Nil, (((0 + 1) + 2) + 3)) {_ + _}

  // (((0 + 1) + 2) + 3) + 0 = 6

除foldRight,foldLeft之外，折叠算法还包括了：reduceRight,reduceLeft,scanRight,scanLeft。

reduceLeft是以第一个，reduceRight是以最后一个List元素作为起始值的折叠算法，没有单独的起始值：

       def reduceLeft[A](l: List[A])(op: (A,A) => A): A = l match {

           case Nil => sys.error("Empty list!")

           case Cons(h,t) => foldLeft(t,h)(op)

       }

       def reduceRight[A](l: List[A])(op: (A,A) => A): A = l match {

           case Cons(h,Nil) => h

           case Cons(h,t) => op(h,reduceRight(t)(op))

       }

  reduceLeft(List(1,2,3)) {_ + _}                  //> res23: Int = 6

  reduceRight(List(1,2,3)) {_ + _}                 //> res24: Int = 6

scanLeft, scanRight 分别把每次op的结果插入新产生的List作为返回结果。

先实现scanLeft:

        def scanLeft[A](l: List[A],z: A)(op: (A,A) => A): List[A] = l match {

            case Nil => Cons(z,Nil)

            case Cons(h,t) => Cons(z,scanLeft(t,op(z,h))(op))

        }

 scanLeft(List(1,2,3),0) {_ + _}                   //> res25: ch3.list.List[Int] = Cons(0,Cons(1,Cons(3,Cons(6,Nil))))

试试简约：

  // (List(x1,x2,x3...x{n-1}, xn) scanLeft acc) op => (...(acc op x1) op x2)...) op x{n-1}) op xn

  // scanLeft(Cons(1,Cons(2,Cons(3,Nil))), 0) {_ + _}

  // Cons(0,scanLeft(Cons(1,Cons(2,Cons(3,Nil))), 0) {_ + _})

  // Cons(0,Cons((0 + 1), scanLeft(Cons(2,Cons(3,Nil)), (0 + 1)) {_ + _}))

  // ==> Cons(0,Cons(1,scanLeft(Cons(2,Cons(3,Nil)), 1) {_ + _}))

  // Cons(0,Cons(1,Cons(2 + 1,scanLeft(Cons(3,Nil), 1 + 2) {_ + _})))

  // ==> Cons(0,Cons(1,Cons(3,scanLeft(Cons(3,Nil), 3) {_ + _})))

  // Cons(0,Cons(1,Cons(3,Cons(3 + 3,foldLeft(Nil, 3 + 3) {_ + _}))))

  // ==> Cons(0,Cons(1,Cons(3,Cons(6,foldLeft(Nil, 6) {_ + _}))))

  // Cons(0,Cons(1,Cons(3,Cons(6,Nil))))

再实现scanRight:

     def reverse[A](l: List[A]): List[A] = foldLeft(l,Nil:List[A]){(acc,h) => Cons(h,acc)}

        def scanRight[A](l: List[A],z: A)(op: (A,A) => A): List[A] =  {

                 var scanned = List(z)

                 var acc = z

                 var ll = reverse(l)

                 var x = z

                 while (

                 ll match {

                        　　　　　 case Nil => false

                         　　　　　case Cons(h,t) => { x = h; ll = t; true }

                 }

             ) {

                　　　　　　   acc = op(acc,x)

                  　　　　　     scanned = Cons(acc,scanned)

                 }

          scanned

       }

实在没能想出用递归算法实现scanRight的方法，只能用while loop来解决了。注意虽然使用了临时变量,但这些变量都是本地封闭的，所以scanRight还是纯函数。scanRight元素遍历（traverse）顺序是反向的，所以用reverse函数把List(1,2,3)先变成List(3,2,1)。

 scanRight(List(1,2,3),0) {_ + _}                  //> res26: ch3.list.List[Int] = Cons(6,Cons(5,Cons(3,Cons(0,Nil))))

注意scanRight和scanLeft的结果不同。这是因为算法不同：元素遍历（traverse）顺序不同。

下面开始示范一下折叠算法作为基本组件（combinator）来实现一些函数功能：

上次实现了函数++，即append。我们同样可以用foldLeft和foldRight来实现：

       def appendByFoldRight[A](l1: List[A], l2: List[A]): List[A] = foldRight(l1,l2){(h,acc) => Cons(h,acc)}

       def appendByFoldLeft[A](l1: List[A], l2: List[A]): List[A] = foldLeft(reverse(l1),l2){(acc,h) => Cons(h,acc)}

 appendByFoldLeft(List(1,2),List(3,4))             //> res27: ch3.list.List[Int] = Cons(1,Cons(2,Cons(3,Cons(4,Nil))))

 appendByFoldRight(List(1,2),List(3,4))            //> res28: ch3.list.List[Int] = Cons(1,Cons(2,Cons(3,Cons(4,Nil))))

由于append的功能是将两个List拼接起来，必须保证最终结果List元素的顺序。所以在appendByFoldLeft里使用了reverse。再注意foldLeft和foldRight在op参数位置是相反的。

之前递归算法实现的函数有些是可以用折叠算法实现的：

       def map_1[A,B](l: List[A])(f: A => B): List[B] = foldRight(l,Nil: List[B]){(h,acc) => Cons(f(h),acc)}

       def filter_1[A](l: List[A])(f: A => Boolean): List[A] = foldRight(l,Nil: List[A]){(h,acc) => if (f(h)) Cons(h,acc) else acc }

       def flatMap_1[A,B](l: List[A])(f: A => List[B]): List[B] = foldRight(l,Nil: List[B]){(h,acc) => appendByFoldRight(f(h),acc)}

       def lengthByFoldRight[A](l: List[A]): Int = foldRight(l,0){(_,acc) => acc + 1 }

       def lengthByFoldLeft[A](l: List[A]): Int = foldLeft(l,0){(acc,_) => acc + 1 }

还有些比较间接的：

     def conCat[A](ll: List[List[A]]): List[A] = foldRight(ll,Nil: List[A]){appendByFoldRight}

这个函数可以用来实现flatMap：

      def flatMap_1[A,B](l: List[A])(f: A => List[B]): List[B] = conCat(map(l)(f))

如果理解以上函数实现方式有困难时可以先从类型匹配上下手，或者试着用“等量替换”方法简约跟踪一下。

泛函编程（7）－数据结构－List－折叠算法的更多相关文章

泛函编程（5）－数据结构（Functional Data Structures)
编程即是编制对数据进行运算的过程.特殊的运算必须用特定的数据结构来支持有效运算.如果没有数据结构的支持,我们就只能为每条数据申明一个内存地址了,然后使用这些地址来操作这些数据,也就是我们熟悉的申明变量 ...
泛函编程（8）－数据结构－Tree
上节介绍了泛函数据结构List及相关的泛函编程函数设计使用,还附带了少许多态类型(Polymorphic Type)及变形(Type Variance)的介绍.有关Polymorphism的详细介绍会 ...
泛函编程（6）－数据结构－List基础
List是一种最普通的泛函数据结构,比较直观,有良好的示范基础.List就像一个管子,里面可以装载一长条任何类型的东西.如需要对管子里的东西进行处理,则必须在管子内按直线顺序一个一个的来,这符合泛函编 ...
泛函编程（30）－泛函IO：Free Monad－Monad生产线
在上节我们介绍了Trampoline.它主要是为了解决堆栈溢出(StackOverflow)错误而设计的.Trampoline类型是一种数据结构,它的设计思路是以heap换stack:对应传统递归算法 ...
泛函编程（29）－泛函实用结构：Trampoline-不再怕StackOverflow
泛函编程方式其中一个特点就是普遍地使用递归算法,而且有些地方还无法避免使用递归算法.比如说flatMap就是一种推进式的递归算法,没了它就无法使用for-comprehension,那么泛函编程也就无 ...
泛函编程（27）－泛函编程模式－Monad Transformer
经过了一段时间的学习,我们了解了一系列泛函数据类型.我们知道,在所有编程语言中,数据类型是支持软件编程的基础.同样,泛函数据类型Foldable,Monoid,Functor,Applicative, ...
泛函编程（21）－泛函数据类型－Monoid
Monoid是数学范畴理论(category theory)中的一个特殊范畴(category).不过我并没有打算花时间从范畴理论的角度去介绍Monoid,而是希望从一个程序员的角度去分析Monoid ...
泛函编程（17）－泛函状态－State In Action
对OOP编程人员来说,泛函状态State是一种全新的数据类型.我们在上节做了些介绍,在这节我们讨论一下State类型的应用:用一个具体的例子来示范如何使用State类型.以下是这个例子的具体描述: 模 ...
泛函编程（9）－异常处理－Option
Option是一种新的数据类型.形象的来描述:Option就是一种特殊的List,都是把数据放在一个管子里:然后在管子内部对数据进行各种操作.所以Option的数据操作与List很相似.不同的是Opt ...

随机推荐

Hadoop－Drill深度剖析
1.概述在<Hadoop - 实时查询Drill>一文当中,笔者给大家介绍如何去处理实时查询这样的业务场景,也是简略的提了一下如何去实时查询HDFS,然起相关细节并未说明.今天给大家细说 ...
用Unity模仿CSGO里的火焰效果
CSGO里的火焰效果和真实的情况比较像,能沿着遮挡物前进,如下是模仿效果. 思路比较简单,开始想的是一圈一圈发出去,但是前圈与后圈的联系不好做,换种思路,每个方向发射一条线,这样根据上一个位置的方位先 ...
Android中GridView使用总结
1.http://blog.csdn.net/hellogv/article/details/4567095 基础篇,GridView最基本的用法 2.http://my.eoe.cn/cainia ...
SQL SERVER 2008 如何查询含有某关键词的表
最新文章:Virson's Blog 文章来自:百度知道 /** 查询一个数据库中所有的数据中是否包含指定字符串 */ ) set @str='字符串' --要搜索的字符串 ) declare tb ...
java 流
http://www.iteye.com/magazines/132-Java-NIO http://liyuanning.blog.163.com/blog/static/4573228620101 ...
C# 实现字符串去重
方法一注:需要.net 3.5框架的支持 string s = "101,102,103,104,105,101,102,103,104,105,106,107,101,108" ...
数据库时间createtime字段数据类型的选取
之前是一直在用datetime类型(db)精度到yyyy-MM-dd HH:mm:ss 或者 date类型精度到 yyyy-MM-dd 用了框架自动注入功能,自己也没去深入没去管他的set赋值值等等 ...
Shell之数学计算
本博客已经迁往http://www.kemaswill.com/, 博客园这边也会继续更新, 欢迎关注~ 数学计算是Shell中比较常用的一种操作, 但是因为shell中所有的变量都默认为字符串, ...
Windows batch，echo到文件不成功，只打印出ECHO is on.
jenkins 执行Windows batch command的时候,如果想要读写文件,echo到文件不成功. bat 代码如下: set ctime=%date%_%time% echo %ctim ...
mysql查看和修改最大数量
通常,mysql的最大连接数默认是100, 最大可以达到16384.1.查看最大连接数:show variables like '%max_connections%';2.修改最大连接数方法一:修改配 ...

泛函编程（7）－数据结构－List－折叠算法

泛函编程（7）－数据结构－List－折叠算法的更多相关文章

随机推荐

热门专题