hadoop伪分布模式,只有一个节点,通常用来做测试。

一、环境准备

  • Linux网络配置已完成,可参见CentOS7网络配置
  • yum源成功挂载,可参见CentOS7本地yum源挂载
  • Linux已安装OracleJDK1.8+,可参见OracleJDK1.8安装
  • zookeeper-3.4.6.tar.gz安装包,hadoop安装包下载
  • 二、创建Hadoop用户(以后有关集群的操作都只用此用户);

  • su 到root用户下,并创建用户;
  • 三、配置SSH互相(免密登录);

  • 生成SSH密钥对(公钥/私钥),在Hadoop用户下;
  • 进入ssh目录;
  • 测试ssh 主机名;
  • 四、解压Hadoop安装包;

  • 在Hadoop用户家目录下创建安装目录;
  • 解压Hadoop安装包(可用xshell等工具将安装包上传到Linux);
  • 五、修改配置文件;

    1. 修改hadoop-env.sh,配置jdk位置;
    2. 修改core-site.xml;
    3. <property>
      <name>fs.defaultFS</name>
      <value>hdfs://hadoop01:9000</value>
      <!—- hadoop01:主机名,9000:端口 -->
      </property> <property>
      <name>hadoop.tmp.dir</name>
      <value>/data/hadoop/tmp</value>
      </property>
    4. hdfs-site.xml配置;
    5. <property>
      <!-- 数据冗余一份 -->
      <name>dfs.replication</name>
      <value>1</value>
      </property>
    6. 配置Mapreduce调用方式;
    7. <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
      </property>
    8. yarn有关的配置;
    9. <property>
      <name>yarn.resourcemanager.hostname</name>
      <value>hadoop01</value>
      <!—hadoop01:主机名 -->
      </property> <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
      </property>

    六、创建Hadoop数据目录(su到root用户下);

    1. su – root

    七、配置系统环境变量;

    1. 在root用户下修改环境变量,并使生效;

    八、格式化namenode节点(注意:只能格式化一次);

    1. 在hodoop用户下,格式化namenode(执行一次命令即可);

    九、启动集群;

    1. 使用hadoop用户启动集群;

    十、验证集群是否部署成功;

    1. 从Windows访问HDFS页面;
    2. 从Windows访问yarn页面;
    3. 能出来以上界面,表明伪分布模式部署成功;

    4. 停止集集群:

    Hadoop2.x伪分模式部署的更多相关文章

    1. Hadoop伪分布式模式部署

      Hadoop的安装有三种执行模式: 单机模式(Local (Standalone) Mode):Hadoop的默认模式,0配置.Hadoop执行在一个Java进程中.使用本地文件系统.不使用HDFS, ...

    2. 初学者值得拥有【Hadoop伪分布式模式安装部署】

      目录 1.了解单机模式与伪分布模式有何区别 2.安装好单机模式的Hadoop 3.修改Hadoop配置文件---五个核心配置文件 (1)hadoop-env.sh 1.到hadoop目录中 ​ 2.修 ...

    3. zookeeper集群&伪集群模式部署

      1.什么是单机部署 一台服务器上面部署一个单机版本的zookeeper服务,用于提供服务. 2.什么是集群部署? 集群部署就是多台服务器上面各部署单独的一个zookeeper服务,然后组建一个集群 3 ...

    4. 分布式集群HA模式部署

      一:HDFS系统架构 (一)利用secondary node备份实现数据可靠性 (二)问题:NameNode的可用性不高,当NameNode节点宕机,则服务终止 二:HA架构---提高NameNode ...

    5. 3-2 Hadoop集群伪分布模式配置部署

      Hadoop伪分布模式配置部署 一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化 启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件 文件系统的 ...

    6. 一脸懵逼学习Hadoop分布式集群HA模式部署(七台机器跑集群)

      1)集群规划:主机名        IP      安装的软件                     运行的进程master    192.168.199.130   jdk.hadoop      ...

    7. spark 源码编译 standalone 模式部署

      本文介绍如何编译 spark 的源码,并且用 standalone 的方式在单机上部署 spark. 步骤如下: 1. 下载 spark 并且解压 本文选择 spark 的最新版本 2.2.0 (20 ...

    8. Spark运行模式与Standalone模式部署

      上节中简单的介绍了Spark的一些概念还有Spark生态圈的一些情况,这里主要是介绍Spark运行模式与Spark Standalone模式的部署: Spark运行模式 在Spark中存在着多种运行模 ...

    9. Hadoop伪分布模式配置部署

      .实验环境说明 注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录 无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍 本实验环境采用带桌面的 ...

    随机推荐

    1. 洛谷P4009 汽车加油行驶问题(分层最短路)

      传送门 说好的网络流24题呢……上次是状压dp,这次怎么又最短路了…… 不过倒是用这题好好学了一下分层图最短路 把每一个位置$(x,y)$,油量剩余$k$表示为一个状态,然后转化成一个$n$进制数,这 ...

    2. 【RMAN备份】数据库备份

      转载请注明地址. 备份片文件名通配符: %c 备份片的拷贝数 %D 位于该月中的第几天 (DD) %M 位于该年中的第几月 (MM) %F 一个基于DBID 唯一的名称,这个格式的形式为c-IIIII ...

    3. 1. C语言对文件的操作

      1. 文件常见输入输出函数与屏幕.键盘输入输出函数的对比,如:fprintf.fscanf等. #define _CRT_SECURE_NO_WARNINGS #include <stdio.h ...

    4. SpringMVC异常的使用

      1.创建一个异常类,需要extend RuntimeException,继承父类中所有的方法 2.局部异常,仅能处理这个Controller中的异常 在Controller中添加异常处理方法 @Exc ...

    5. CF165D Beard Graph

      $ \color{#0066ff}{ 题目描述 }$ 给定一棵树,有m次操作. 1 x 把第x条边染成黑色 2 x 把第x条边染成白色 3 x y 查询x~y之间的黑边数,存在白边输出-1 \(\co ...

    6. opencv学习笔记(六)---图像梯度

      图像梯度的算法有很多方法:sabel算子,scharr算子,laplacian算子,sanny边缘检测(下个随笔)... 这些算子的原理可参考:https://blog.csdn.net/poem_q ...

    7. Linux之旅

      如今 linux 随着云服务的狂扫全球之势,对吾等准开发人员而言也不可继续视而不见了,硬着头皮调用情绪开始 Linux 之旅. 一.主机准备 既然 Linux,必然和日常工作的环境产生了“冲突”,经过 ...

    8. React应用程序设计过程中如何区分模块到底是state还是props?

      根据官方文档,满足以下任意条件的模块,就不是State,原文如下: 1.Is it passed in from a parent via props? If so, it probably isn’ ...

    9. numpy-1

      NumPy数组 NumPy数组是一个多维数组对象,称为ndarray.其由两部分组成: 实际的数据 描述这些数据的元数据 大部分操作仅针对于元数据,而不改变底层实际的数据. 关于NumPy数组有几点必 ...

    10. 中间件使用之(UA,IP,selenium)的使用

      一.UA池:User-Agent池 - 作用:尽可能多的将scrapy工程中的请求伪装成不同类型的浏览器身份. - 操作流程: 1.在下载中间件中拦截请求 2.将拦截到的请求的请求头信息中的UA进行篡 ...