一.Map阶段: a. 文件切片之后,每一个切片对应一个MapTask b. 在MapTask中,默认按行读取,每读取一行,就调用一次map方法 c. map方法在执行的时候会将结果(这个结果中已经包含了分区信息)写到MapTask自带的缓冲区中.注意:每一个MapTask都会自带一个缓冲区 d. 当数据放到缓冲区中之后,数据在缓冲区中会进行分区(partition).排序(sort)(扩展:在缓冲区中排序使用的排序算法是快速排序).如果指定了合并类(combine),数据还会进行combine…