hadoop伪分布模式,只有一个节点,通常用来做测试。

一、环境准备

  • Linux网络配置已完成,可参见CentOS7网络配置
  • yum源成功挂载,可参见CentOS7本地yum源挂载
  • Linux已安装OracleJDK1.8+,可参见OracleJDK1.8安装
  • zookeeper-3.4.6.tar.gz安装包,hadoop安装包下载
  • 二、创建Hadoop用户(以后有关集群的操作都只用此用户);

  • su 到root用户下,并创建用户;
  • 三、配置SSH互相(免密登录);

  • 生成SSH密钥对(公钥/私钥),在Hadoop用户下;
  • 进入ssh目录;
  • 测试ssh 主机名;
  • 四、解压Hadoop安装包;

  • 在Hadoop用户家目录下创建安装目录;
  • 解压Hadoop安装包(可用xshell等工具将安装包上传到Linux);
  • 五、修改配置文件;

    1. 修改hadoop-env.sh,配置jdk位置;
    2. 修改core-site.xml;
    3. <property>
      <name>fs.defaultFS</name>
      <value>hdfs://hadoop01:9000</value>
      <!—- hadoop01:主机名,9000:端口 -->
      </property> <property>
      <name>hadoop.tmp.dir</name>
      <value>/data/hadoop/tmp</value>
      </property>
    4. hdfs-site.xml配置;
    5. <property>
      <!-- 数据冗余一份 -->
      <name>dfs.replication</name>
      <value>1</value>
      </property>
    6. 配置Mapreduce调用方式;
    7. <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
      </property>
    8. yarn有关的配置;
    9. <property>
      <name>yarn.resourcemanager.hostname</name>
      <value>hadoop01</value>
      <!—hadoop01:主机名 -->
      </property> <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
      </property>

    六、创建Hadoop数据目录(su到root用户下);

    1. su – root

    七、配置系统环境变量;

    1. 在root用户下修改环境变量,并使生效;

    八、格式化namenode节点(注意:只能格式化一次);

    1. 在hodoop用户下,格式化namenode(执行一次命令即可);

    九、启动集群;

    1. 使用hadoop用户启动集群;

    十、验证集群是否部署成功;

    1. 从Windows访问HDFS页面;
    2. 从Windows访问yarn页面;
    3. 能出来以上界面,表明伪分布模式部署成功;

    4. 停止集集群:

    Hadoop2.x伪分模式部署的更多相关文章

    1. Hadoop伪分布式模式部署

      Hadoop的安装有三种执行模式: 单机模式(Local (Standalone) Mode):Hadoop的默认模式,0配置.Hadoop执行在一个Java进程中.使用本地文件系统.不使用HDFS, ...

    2. 初学者值得拥有【Hadoop伪分布式模式安装部署】

      目录 1.了解单机模式与伪分布模式有何区别 2.安装好单机模式的Hadoop 3.修改Hadoop配置文件---五个核心配置文件 (1)hadoop-env.sh 1.到hadoop目录中 ​ 2.修 ...

    3. zookeeper集群&伪集群模式部署

      1.什么是单机部署 一台服务器上面部署一个单机版本的zookeeper服务,用于提供服务. 2.什么是集群部署? 集群部署就是多台服务器上面各部署单独的一个zookeeper服务,然后组建一个集群 3 ...

    4. 分布式集群HA模式部署

      一:HDFS系统架构 (一)利用secondary node备份实现数据可靠性 (二)问题:NameNode的可用性不高,当NameNode节点宕机,则服务终止 二:HA架构---提高NameNode ...

    5. 3-2 Hadoop集群伪分布模式配置部署

      Hadoop伪分布模式配置部署 一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化 启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件 文件系统的 ...

    6. 一脸懵逼学习Hadoop分布式集群HA模式部署(七台机器跑集群)

      1)集群规划:主机名        IP      安装的软件                     运行的进程master    192.168.199.130   jdk.hadoop      ...

    7. spark 源码编译 standalone 模式部署

      本文介绍如何编译 spark 的源码,并且用 standalone 的方式在单机上部署 spark. 步骤如下: 1. 下载 spark 并且解压 本文选择 spark 的最新版本 2.2.0 (20 ...

    8. Spark运行模式与Standalone模式部署

      上节中简单的介绍了Spark的一些概念还有Spark生态圈的一些情况,这里主要是介绍Spark运行模式与Spark Standalone模式的部署: Spark运行模式 在Spark中存在着多种运行模 ...

    9. Hadoop伪分布模式配置部署

      .实验环境说明 注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录 无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍 本实验环境采用带桌面的 ...

    随机推荐

    1. 关于函数传参的其他问题(const形参实参/可变形参)

      const 形参和实参 当形参是 const 变量时,实参是 const 或者不是 const 变量都可以. 实参初始化形参时会忽略掉顶层 const: void gel(const int a){ ...

    2. Django模板—-自定义过滤器和标签

      一.filter和simple_tag 1.在settings中的INSTALLED_APPS配置当前app,不然django无法找到自定义的simple_tag. 2.在app中创建template ...

    3. Python基本数据类型集合、格式化、函数

      一.变量总结 1.1 变量定义 记录某种状态或者数值,并用某个名称代表这个数值或状态. 1.2 变量在内存中的表现形式 Python 中一切皆为对象,数字是对象,列表是对象,函数也是对象,任何东西都是 ...

    4. CF165D Beard Graph

      $ \color{#0066ff}{ 题目描述 }$ 给定一棵树,有m次操作. 1 x 把第x条边染成黑色 2 x 把第x条边染成白色 3 x y 查询x~y之间的黑边数,存在白边输出-1 \(\co ...

    5. [jvm]基于jvm的线程实现

      一.线程的实现 学过操作系统的肯定都知道: 进程:是并发执行的程序在执行过程中分配和管理资源的基本单位,是一个动态概念,竞争计算机系统资源的基本单位. 线程:是进程的一个执行单元,是进程内可调度实体. ...

    6. ajax beforeSend中无效果

      asnyc:false 与beforesend 同时使用 无效果

    7. gevent 传参, 中文编码

      #coding=utf-8 import os from gevent import monkey,pool monkey.patch_all() import gevent import time ...

    8. Bootstrap点击弹出注册登录

      <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

    9. 【算法笔记】B1021 个位数统计

      1021 个位数统计 (15 分) 给定一个 k 位整数 N=d​k−1​​10​k−1​​+⋯+d​1​​10​1​​+d​0​​ (0≤d​i​​≤9, i=0,⋯,k−1, d​k−1​​> ...

    10. 查找表set和map 349, 350

      两类查找问题: 1)查找有无: - 某个元素是否存在,通常使用set(集合) 2)查找对应关系(键值对应) - 某个元素出现了几次,map(字典) set和map都不允许里面的键值重复. 常见操作: ...