安装一个Hadoop分布式集群 最小化的Hadoop已经可以满足学习过程中大部分需求,但是为了研究Hadoop集群运行机制,部署一个类生产的环境还是有必要的.因为集群机器比较少,笔者没有配置ssh,所以就需要在每一台机器上手动启动服务.启动上相对繁琐一些,优点是可以高度自定义集群中的任务节点数量,从而更好的理解集群中各个进程的作用. 一.环境准备 笔者认为一个Hadoop集群管理着两种资源,计算资源(CPU和内存)与存储资源(数据存储).所以就对应了两类服务,yarn和HDFS: yarn re…