函数式编程之foldLeftViaFoldRight
问题来自 Scala 函数式编程 一书的习题, 让我很困扰, 感觉函数式编程有点神学的感觉.后面看懂之后, 又觉得函数式编程所提供的高阶抽象是多么的强大. 这个问题让我发呆了好久, 现在把自己形成的想法分享下, 如果能少让一个人为这个问题烦恼, 那就再好不过了:)
问题: 如何通过函数 foldRight 实现 左折叠(left fold)操作 ?
这里只是讨论理论上的可行性, 实际中都是通过函数 foldLeft 实现右折叠操作,
因为函数 foldLeft 是栈安全的(不会因为压栈太深导致栈溢出).
答案:
def foldLeftViaFoldRight[A,B](l: List[A], z: B)(f: (B,A) => B): B = {
foldRight(l, (b: B) => b)((a, g) => b => g(f(b, a)))(z)
}
那么下面我们来一步步解析这个答案:)
左折叠 与 右折叠
我们先看一下函数 foldRight 和 foldLeft 的定义:
def foldRight[A, B](l: List[A], b: B)(f: (A, B) => B):B = l match {
case Nil => z
case h::t => f(h, foldRight(t, b)(f))
}
@annotation.tailrec
def foldLeft[A, B](as: List[A], z: B)(f: (B, A) => B):B = as match {
case Nil => z
case h::t => foldLeft(t, f(z, h))(f)
}
让我们看看一个列表L List(1, 2, 3) 左折叠和右折叠操作(foldRight) 的运行过程:
// 左折叠
f(3, f(2, f(1, b)))
// 右折叠
f(1, f(2, f(3, b)))
从上面可以看到
- 左折叠操作, 初始值
b先和列表最左边的元素进行f的运算, 从左往右依次计算. - 右折叠操作, 初始值
b先和列表最右边的元素进行f的运算, 从右往左依次计算.
再来看一个例子就更加清楚了
println(foldLeft(List(1,2,3), 0)((a, b) => { println(a, b); b + a}))
println(foldRight(List(1,2,3), 0)((a, b) => { println (a, b); b + a }))
/* output
(1, 0)
(2, 1)
(3, 3)
6
(3, 0)
(2, 3)
(1, 5)
6
*/
复合函数
首先看看什么是复合函数? 下面是百度百科的定义
设函数y=f(u[x])的定义域为 Du,值域为 Mu,函数 u=g(x) 的定义域为 Dx,值域为 Mx,
如果 Mx∩Du≠Ø,那么对于 Mx∩Du 内的任意一个x经过u;有唯一确定的y值与之对应,则变量x与y之间通过变量u形成的一种函数关系,这种函数称为复合函数(composite function),记为:y=f[g(x)],其中x称为自变量,u为中间变量,y为因变量(即函数)。
不是任何两个函数都可以复合成一个复合函数,只有当Mx∩Du≠Ø时,二者才可以构成一个复合函数。
让我们创建两个函数:
scala> def f(s: String) = "f(" + s + ")"
f: (String)java.lang.String
scala> def g(s: String) = "g(" + s + ")"
g: (String)java.lang.String
compose
compose 组合其他函数形成一个新的函数 f(g(x))
scala> val fComposeG = f _ compose g _
fComposeG: (String) => java.lang.String = <function>
scala> fComposeG("hello")
res0: java.lang.String = f(g(hello))
andThen
andThen 和 compose很像,但是调用顺序是先调用第一个函数,然后调用第二个,即g(f(x))
scala> val fAndThenG = f _ andThen g _
fAndThenG: (String) => java.lang.String = <function>
scala> fAndThenG("hello")
res1: java.lang.String = g(f(hello))
关键一步
这里把解决方法再贴出来, 方便对照
def foldLeftViaFoldRight[A,B](l: List[A], z: B)(f: (B,A) => B): B =
foldRight(l, (b:B) => b)((a, g) => b => g(f(b, a)))(z)
将 匿名函数 ((a, g) => b => g(f(b, a))) 改写为
def h(a: A, g: B => B): (B => B) =
g compose ((x: B) => f(x, a));
怎么想?
通过上面函数的定义, 我们可以把解决方法写成
def foldLeftViaFoldRight_2[A,B](l: List[A], z: B)(f: (B,A) => B): B = {
def h(a: A, g: B => B): (B => B) = g compose ((x: B) => f(x, a))
def identity(b: B) = b // 恒等函数
foldRight(l, identity _)(h _)(z)
}
我们想通过函数 foldRight 实现 foldLeft, 而foldRight 从右边处理列表元素, 而我们想从左边处理列表元素.
以列表 List(1, 2, 3)为例,
由 右折叠的定义, 计算过程为:
// 右折叠
h(1, h(2, h(3, identity)))
而我们想要实现左折叠操作, 即函数的最终运行结果应该是
f(f(f(1, z), 2), 3)
这里的技巧就在于函数 g 的类型为 B => B, 函数 h 类型也是 B => B,函数 identity 的类型为 B => B; 这样就能进行组成一条符合函数链;
然后我们通过复合函数链完成上述的思路.
有一点在这很重要, 那就是, g 和 h 都是高阶抽象函数, 你可能很想知道函数 g 的具体实现是什么, 其实这是不必要的也是错误的想法;
我们不要在意 g 具体实现是什么, 那么我们要关注什么呢?
那就是函数 g, h, identity 类型为 B => B, 一个例子就能让你清楚的明白上面再说什么了, 你也能看出来函数 g 其实并不是一个具体的函数, 它随着计算阶段也在不停的变动, 这就是理解的难点所在
例子
现在让我们看一下当我们传递列表 List(1, 2)时, 发生了什么:
val l = List(1, 2)
foldRight(l, identity[B] _)(h _)
= h(1, h(2, identity([B]))) // 由 右折叠 的定义可知
= h(1, identity[B] compose ((x: B) => f(x, 2))) // 展开里面的 `h`
// 由于 identity[B] 是恒等函数,
// identity[B] compose ((x: B) => f(x, 2)) =
// identity(((x: B) => f(x, 2))) = ((x: B) => f(x, 2))
= h(1, ((x: B) => f(x, 2)))
// 展开另一个 'h'
= ((x: B) => f(x, 2)) compose ((x: B) => f(x, 1))
// 由 function composition 定义可知 f1 _ compose f2 = f1(f2)
= (x: B) => f(f(x, 1), 2) // 左折叠操作
看看上面的过程, 我们实现了转换:
h(1, h(2, identity([B]))) => f(f(x, 1), 2)
即通过右折叠函数 foldRight 实现了左折叠操作
这里函数 g 先后是,
- identity([B])
- ((x: B) => f(x, 2))
正是函数类型为 "B => B" 进行复合的技巧所在
并且我们看到, 对于列表的每一元素 a, 都会建立一个 包含函数 g 的函数 h, 并且每个新的函数h的都是前一个函数 h 的输入。
一点思考
1. 关于函数 identity 是如何得来的 ?
如果列表 l 是空列表, 那么 foldLeftViaFoldRight 应该返回 z,
所以函数 h 应该是一个恒等函数, 所以我们将恒等函数作为第二个参数传递给 foldRight.
2. 这里通过建立一条复合函数链, 通过利用函数压栈中, 栈的先进后出特性实现了计算顺序的翻转; 所以方法是非栈安全的, 数据太大有栈溢出的风险, 这里只是说明理论的可行xing
函数式编程之foldLeftViaFoldRight的更多相关文章
- Python函数式编程之map()
Python函数式编程之map() Python中map().filter().reduce()这三个都是应用于序列的内置函数. 格式: map(func, seq1[, seq2,…]) 第一个参数 ...
- python3 第二十一章 - 函数式编程之return函数和闭包
我们来实现一个可变参数的求和.通常情况下,求和的函数是这样定义的: def calc_sum(*args): ax = 0 for n in args: ax = ax + n return ax 但 ...
- python3 第二十章 - 函数式编程之Higher-order function(高阶函数)
什么是高阶函数?把函数作为参数传入或把函数做为结果值返回,这样的函数称为高阶函数,函数式编程就是指这种高度抽象的编程范式.函数式编程的特点: 函数本身可以赋值给变量,赋值后变量为函数: 允许将函数本身 ...
- Python函数式编程之lambda表达式
一:匿名函数的定义 lambda parameter_list: expression 二:三元表达式 条件为真时返回的结果 if 条件判断 else 条件为假的时候返回的结果 三:map map(f ...
- 函数式编程之-bind函数
Bind函数 Bind函数在函数式编程中是如此重要,以至于函数式编程语言会为bind函数设计语法糖.另一个角度Bind函数非常难以理解,几乎很少有人能通过简单的描述说明白bind函数的由来及原理. 这 ...
- 函数式编程之-F#类型系统
在深入到函数式编程思想之前,了解函数式独有的类型是非常有必要的.函数式类型跟OO语言中的数据结构截然不同,这也导致使用函数式编程语言来解决问题的思路跟OO的思路有明显的区别. 什么是类型?类型在编程语 ...
- 函数式编程之-Partial application
上一篇关于Currying的介绍,我们提到F#是如何做Currying变换的: let addWithThreeParameters x y z = x + y + z let intermediat ...
- 函数式编程之-Currying
这个系列涉及到了F#这门语言,也许有的人觉得这样的语言遥不可及,的确我几乎花了2-3年的时间去了解他:也许有人觉得学习这样的冷门语言没有必要,我也赞同,那么我为什么要花时间去学习呢?作为一门在Tiob ...
- java函数式编程之Supplier
原创 2016年12月25日 10:02:52 标签: 函数式编程 / java 3250 描述:Supplier< T>接口没有入参,返回一个T类型的对象,类似工厂方法. 源码: pub ...
随机推荐
- 关于C++ const 的全面总结《转》
C++中的const关键字的用法非常灵活,而使用const将大大改善程序的健壮性,本人根据各方面查到的资料进行总结如下,期望对朋友们有所帮助. Const 是C++中常用的类型修饰符,常类型是指使用类 ...
- Spark ML源码分析之一 设计框架解读
本博客为作者原创,如需转载请注明参考 在深入理解Spark ML中的各类算法之前,先理一下整个库的设计框架,是非常有必要的,优秀的框架是对复杂问题的抽象和解剖,对这种抽象的学习本身 ...
- 软件License认证方案的设计思路
销售license是商业软件的贯用商业模式.用户向商家购买软件安装盘搭载license许可,才可以使用该软件.我们作为软件开发者,为了保护自身的权益,在软件开发过程中也不可避免的会设计license管 ...
- Net 面试随想
佳节已去,至今已半月有余,近来园中唱衰net的声音幽幽而起,net不成熟的大环境一直被作为诟病,net core的跨平台去年抄的火热,是否为net 崛起的最后一根稻草,结合我面试的情况,作为小白,嘟囔 ...
- 学习Javascript闭包(Closure)及几个经典面试题理解
今天遇到一个面试题,结果让我百思不得其解.后来在查阅了各种文档后,理清了来龙去脉.让我们先来看看这道题: function Foo( ){ var i = 0; return function( ){ ...
- VMware下安装centos7及网络配置
之前遇到过用虚拟机安装上centos7上不了网,昨天解决了,但是手抽删错了,把centos7误删了,今天就一起安装下. 首先打开VMware,我这里用的版本是VMware12,然后我们新建虚拟机 下一 ...
- 31.Django缓存和信号
缓存 由于Django是动态网站,所有每次请求均会去数据进行相应的操作,当程序访问量大时,耗时必然会更加明显,最简单解决方式是使用:缓存,缓存将某个views的返回值保存至内存或者memcache中, ...
- Scala编程快速入门系列(二)
目 录 一.Scala概述 二.Scala数据类型 三.Scala函数 四.Scala集合 五.Scala伴生对象 六.Scala trait 七.Actor 八.隐式转换与隐式参数 九.Sca ...
- 为什么覆写equals必须要覆写hashCode?
============================================= 原文链接: 为什么覆写equals必须要覆写hashCode? 转载请注明出处! ============= ...
- UML类图二
在软件系统中,类并不是孤立存在的,类与类之间存在各种关系,对于不同类型的关系,UML提供了不同的表示方式. 1. 关联关系 关联(Association)关系是类与类之间最常用的一种关系, ...