前言 第一章主要讲的是hadoop基础知识.老师讲的还是比较全面简单的,起码作为一个非专业码农以及数据库管理人员,也能狗大致了解其特点 首先是概括图(以hadoop2.0为例) 一.Hadoop基础架构: HDFS(分布式存储层,主要储存数据) YARN(集群资源管理层) MapReduce 分布式数据处理,java HDFS为最基本的,分布式文件系统 Redundant, Reliable Storage 它可扩展性好,资源不够时再买服务器就可以直接集成了.另外数据重分布也很方便,对服务器崩…