摘要: MR是啥:编程模型,用户只需编写Map,Reduce两个函数,系统完成分布式计算 MR系统是啥:在大量普通计算机上实现并行化计算,系统只关心如何分割数据.大规模集群的调度.集群容错.集群通信 MR在Google的并行处理能力:上千台机器上,处理TB级数据 介绍: 问题:海量数据.数据分发.并行计算.容错,开发.维护复杂,且不可复用 核心:技术问题--->制约业务开发 解决:封装分布式处理的所有细节,提供统一的计算模型(MapReduce) 为什么是MapReduce:来源Lisp,函数式…