如果你了解云计算的最重要的计算框架Mapreduce,你就对Python提供的map和reduce对象有很好的理解,在大数据面前,单机计算愈加力不从心,分布式计算也就是后来的云计算的框架担当大任,它提高了效率.节省了时间,但是计算量并没有减少.有点类似分久必合,合久必分的趋势.map就是对任务分发,实现分布式计算,reduce就是把分布式计算的结果进行聚合. Map和Reduce过程像是为控制新型肺炎而建设的火神山.雷神山医院的建设过程,如果建设承建集团用一个10人建设队竣工需要建设600天的话…