我们继续通过项目强化掌握Combiner和Partitioner优化Hadoop性能 1.项目介绍 本项目我们使用明星搜索指数数据,分别统计出搜索指数最高的男明星和女明星. 2.数据集 3.分析 基于项目的需求,我们通过以下几步完成: 1.编写Mapper类,按需求将数据集解析为key=gender,value=name+hotIndex,然后输出. 2.编写Combiner类,合并Mapper输出结果,然后输出给Reducer. 3.编写Partitioner类,按性别,将结果指定给不同的Re