1. Hadoop介绍 1.1 什么是Hadoop 开源的,可靠的,分布式的,可伸缩的 提供的功能: 利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理 1.2 处理方式 大众角度 数据量大,海量 技术人员角度 如何存储 如何计算 公司决策层 1.3 分布式 由分布在不同主机上的进程协同在一起,构成整个应用. 分布式软件系统 该软件系统会划分成多个子系统或模块,各自运行在不同的机器上,子系统或者模块之间通过网络通信进行写协作,实现最终整体功能 1.4 Hadoop产生背景 HAD