1.2 Hadoop快速入门 1.Hadoop简介 Hadoop是一个开源的分布式计算平台. 提供功能:利用服务器集群,根据用户定义的业务逻辑,对海量数据的存储(HDFS)和分析计算(MapReduce) 2.Hadoop核心组件 Common--基础组件 HDFS--分布式文件存储系统 MapReduce--分布式运算编程框架 基于JAVA语言,包含2个步骤,分别是map和reduce map:对数据进行指定操作生成键值对的中间数据 reduce:对map的结果进行规约,得到最终结果 yarn…