hadoop伪分布模式,只有一个节点,通常用来做测试。

一、环境准备

  • Linux网络配置已完成,可参见CentOS7网络配置
  • yum源成功挂载,可参见CentOS7本地yum源挂载
  • Linux已安装OracleJDK1.8+,可参见OracleJDK1.8安装
  • zookeeper-3.4.6.tar.gz安装包,hadoop安装包下载
  • 二、创建Hadoop用户(以后有关集群的操作都只用此用户);

  • su 到root用户下,并创建用户;
  • 三、配置SSH互相(免密登录);

  • 生成SSH密钥对(公钥/私钥),在Hadoop用户下;
  • 进入ssh目录;
  • 测试ssh 主机名;
  • 四、解压Hadoop安装包;

  • 在Hadoop用户家目录下创建安装目录;
  • 解压Hadoop安装包(可用xshell等工具将安装包上传到Linux);
  • 五、修改配置文件;

    1. 修改hadoop-env.sh,配置jdk位置;
    2. 修改core-site.xml;
    3. <property>
      <name>fs.defaultFS</name>
      <value>hdfs://hadoop01:9000</value>
      <!—- hadoop01:主机名,9000:端口 -->
      </property> <property>
      <name>hadoop.tmp.dir</name>
      <value>/data/hadoop/tmp</value>
      </property>
    4. hdfs-site.xml配置;
    5. <property>
      <!-- 数据冗余一份 -->
      <name>dfs.replication</name>
      <value>1</value>
      </property>
    6. 配置Mapreduce调用方式;
    7. <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
      </property>
    8. yarn有关的配置;
    9. <property>
      <name>yarn.resourcemanager.hostname</name>
      <value>hadoop01</value>
      <!—hadoop01:主机名 -->
      </property> <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
      </property>

    六、创建Hadoop数据目录(su到root用户下);

    1. su – root

    七、配置系统环境变量;

    1. 在root用户下修改环境变量,并使生效;

    八、格式化namenode节点(注意:只能格式化一次);

    1. 在hodoop用户下,格式化namenode(执行一次命令即可);

    九、启动集群;

    1. 使用hadoop用户启动集群;

    十、验证集群是否部署成功;

    1. 从Windows访问HDFS页面;
    2. 从Windows访问yarn页面;
    3. 能出来以上界面,表明伪分布模式部署成功;

    4. 停止集集群:

    Hadoop2.x伪分模式部署的更多相关文章

    1. Hadoop伪分布式模式部署

      Hadoop的安装有三种执行模式: 单机模式(Local (Standalone) Mode):Hadoop的默认模式,0配置.Hadoop执行在一个Java进程中.使用本地文件系统.不使用HDFS, ...

    2. 初学者值得拥有【Hadoop伪分布式模式安装部署】

      目录 1.了解单机模式与伪分布模式有何区别 2.安装好单机模式的Hadoop 3.修改Hadoop配置文件---五个核心配置文件 (1)hadoop-env.sh 1.到hadoop目录中 ​ 2.修 ...

    3. zookeeper集群&伪集群模式部署

      1.什么是单机部署 一台服务器上面部署一个单机版本的zookeeper服务,用于提供服务. 2.什么是集群部署? 集群部署就是多台服务器上面各部署单独的一个zookeeper服务,然后组建一个集群 3 ...

    4. 分布式集群HA模式部署

      一:HDFS系统架构 (一)利用secondary node备份实现数据可靠性 (二)问题:NameNode的可用性不高,当NameNode节点宕机,则服务终止 二:HA架构---提高NameNode ...

    5. 3-2 Hadoop集群伪分布模式配置部署

      Hadoop伪分布模式配置部署 一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化 启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件 文件系统的 ...

    6. 一脸懵逼学习Hadoop分布式集群HA模式部署(七台机器跑集群)

      1)集群规划:主机名        IP      安装的软件                     运行的进程master    192.168.199.130   jdk.hadoop      ...

    7. spark 源码编译 standalone 模式部署

      本文介绍如何编译 spark 的源码,并且用 standalone 的方式在单机上部署 spark. 步骤如下: 1. 下载 spark 并且解压 本文选择 spark 的最新版本 2.2.0 (20 ...

    8. Spark运行模式与Standalone模式部署

      上节中简单的介绍了Spark的一些概念还有Spark生态圈的一些情况,这里主要是介绍Spark运行模式与Spark Standalone模式的部署: Spark运行模式 在Spark中存在着多种运行模 ...

    9. Hadoop伪分布模式配置部署

      .实验环境说明 注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录 无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍 本实验环境采用带桌面的 ...

    随机推荐

    1. [AGC005C]Tree Restoring 构造

      Description ​ 给出一个数组a,要求构造一颗树,使节点x距离最远的点的距离为\(a_x\). Input ​ 第一行一个正整数NN(2≤N≤1002≤N≤100) ​ 接下来一行,有NN个 ...

    2. linux负载均衡与性能监控

      平均负载是单位时间内, 系统处于可运行状态和不可中断状态的平均进程数( 平均活跃进程数 ) 可运行状体好理解, 就是进程正在运行状态Running和可运行状态Runnable... 这里需要注意的是 ...

    3. 两种unix网络编程线程池的设计方法

      unp27章节中的27.12中,我们的子线程是通过操作共享任务缓冲区,得到task的,也就是通过线程间共享的clifd[]数组,这个数组其实就是我们的任务数组,得到其中的connfd资源. 我们对这个 ...

    4. 安装jdk环境

      1.jdk安装包准备: 下载链接:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html ...

    5. 22.Container With Most Water(能装最多水的容器)

      Level:   Medium 题目描述: Given n non-negative integers a1, a2, ..., an , where each represents a point ...

    6. xml转换csv

      /// <summary> /// xml文件转换为CSV /// </summary> /// <param name="fileName"> ...

    7. redis源码搭建以及配置主从服务器

      2018-10-25 关闭防火墙: systemctl stop firewalld.service #停止firewall systemctl disable firewalld.service # ...

    8. Shiro登录的故事

      从前,有一个subject,他有一个UsernamePasswordToken的实例,也就是token: 他准备登录,于是调用subject.login(AuthenticationToken tok ...

    9. 剑指offer——面试题5:替换空格

      利用STL: #include"iostream" #include"stdio.h" #include"algorithm" using ...

    10. django contenttype 表应用

      Django contenttypes 应用 contenttypes 是Django内置的一个应用,可以追踪项目中所有app和model的对应关系,并记录在ContentType表中. 每当我们创建 ...