hadoop伪分布模式,只有一个节点,通常用来做测试。

一、环境准备

  • Linux网络配置已完成,可参见CentOS7网络配置
  • yum源成功挂载,可参见CentOS7本地yum源挂载
  • Linux已安装OracleJDK1.8+,可参见OracleJDK1.8安装
  • zookeeper-3.4.6.tar.gz安装包,hadoop安装包下载
  • 二、创建Hadoop用户(以后有关集群的操作都只用此用户);

  • su 到root用户下,并创建用户;
  • 三、配置SSH互相(免密登录);

  • 生成SSH密钥对(公钥/私钥),在Hadoop用户下;
  • 进入ssh目录;
  • 测试ssh 主机名;
  • 四、解压Hadoop安装包;

  • 在Hadoop用户家目录下创建安装目录;
  • 解压Hadoop安装包(可用xshell等工具将安装包上传到Linux);
  • 五、修改配置文件;

    1. 修改hadoop-env.sh,配置jdk位置;
    2. 修改core-site.xml;
    3. <property>
      <name>fs.defaultFS</name>
      <value>hdfs://hadoop01:9000</value>
      <!—- hadoop01:主机名,9000:端口 -->
      </property> <property>
      <name>hadoop.tmp.dir</name>
      <value>/data/hadoop/tmp</value>
      </property>
    4. hdfs-site.xml配置;
    5. <property>
      <!-- 数据冗余一份 -->
      <name>dfs.replication</name>
      <value>1</value>
      </property>
    6. 配置Mapreduce调用方式;
    7. <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
      </property>
    8. yarn有关的配置;
    9. <property>
      <name>yarn.resourcemanager.hostname</name>
      <value>hadoop01</value>
      <!—hadoop01:主机名 -->
      </property> <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
      </property>

    六、创建Hadoop数据目录(su到root用户下);

    1. su – root

    七、配置系统环境变量;

    1. 在root用户下修改环境变量,并使生效;

    八、格式化namenode节点(注意:只能格式化一次);

    1. 在hodoop用户下,格式化namenode(执行一次命令即可);

    九、启动集群;

    1. 使用hadoop用户启动集群;

    十、验证集群是否部署成功;

    1. 从Windows访问HDFS页面;
    2. 从Windows访问yarn页面;
    3. 能出来以上界面,表明伪分布模式部署成功;

    4. 停止集集群:

    Hadoop2.x伪分模式部署的更多相关文章

    1. Hadoop伪分布式模式部署

      Hadoop的安装有三种执行模式: 单机模式(Local (Standalone) Mode):Hadoop的默认模式,0配置.Hadoop执行在一个Java进程中.使用本地文件系统.不使用HDFS, ...

    2. 初学者值得拥有【Hadoop伪分布式模式安装部署】

      目录 1.了解单机模式与伪分布模式有何区别 2.安装好单机模式的Hadoop 3.修改Hadoop配置文件---五个核心配置文件 (1)hadoop-env.sh 1.到hadoop目录中 ​ 2.修 ...

    3. zookeeper集群&伪集群模式部署

      1.什么是单机部署 一台服务器上面部署一个单机版本的zookeeper服务,用于提供服务. 2.什么是集群部署? 集群部署就是多台服务器上面各部署单独的一个zookeeper服务,然后组建一个集群 3 ...

    4. 分布式集群HA模式部署

      一:HDFS系统架构 (一)利用secondary node备份实现数据可靠性 (二)问题:NameNode的可用性不高,当NameNode节点宕机,则服务终止 二:HA架构---提高NameNode ...

    5. 3-2 Hadoop集群伪分布模式配置部署

      Hadoop伪分布模式配置部署 一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化 启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件 文件系统的 ...

    6. 一脸懵逼学习Hadoop分布式集群HA模式部署(七台机器跑集群)

      1)集群规划:主机名        IP      安装的软件                     运行的进程master    192.168.199.130   jdk.hadoop      ...

    7. spark 源码编译 standalone 模式部署

      本文介绍如何编译 spark 的源码,并且用 standalone 的方式在单机上部署 spark. 步骤如下: 1. 下载 spark 并且解压 本文选择 spark 的最新版本 2.2.0 (20 ...

    8. Spark运行模式与Standalone模式部署

      上节中简单的介绍了Spark的一些概念还有Spark生态圈的一些情况,这里主要是介绍Spark运行模式与Spark Standalone模式的部署: Spark运行模式 在Spark中存在着多种运行模 ...

    9. Hadoop伪分布模式配置部署

      .实验环境说明 注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录 无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍 本实验环境采用带桌面的 ...

    随机推荐

    1. Python3 + django2.0 + apache2 + ubuntu14部署网站上线

      自己尝试在本地搭建了 Django 项目后,想部署到自己云服务器上,经常多次尝试和多次踩坑(捂脸),总结如下: 环境:ubuntu14, django2.0, apache2. 1.首先安装需要的库包 ...

    2. pycharm 2016 注册(pycharm-professional-2016.3.2)

      BIG3CLIK6F-eyJsaWNlbnNlSWQiOiJCSUczQ0xJSzZGIiwibGljZW5zZWVOYW1lIjoibGFuIHl1IiwiYXNzaWduZWVOYW1lIjoiI ...

    3. 一款给力的一键复制js插件-clipboard.js

      一款没有依赖的.给力的一键复制的JS插件   点我前往github 案例demo见下载包内demo文件夹. 这里晒出最常用的几种方式,以供不时之需. <!DOCTYPE html> < ...

    4. 004 Android XML文件常用五大页面布局方式

      1.线性布局(LinearLayout)最常用 <1>使用线性布局,首先在xml文件中修改布局为LinearLayout 修改完成后,可在Component Tree中看见如下内容: &l ...

    5. LeetCode记录之28——Implement strStr()

      Implement strStr(). Returns the index of the first occurrence of needle in haystack, or -1 if needle ...

    6. POJ_2431 Expedition 【数据结构】

      一.题面 POJ2431 二.分析 主要说几个坑 1.给出的点需要根据下标排序. 2.根据不同的方式要把起始点或者终点加进去.我没有转换距离,而是直接从起始点到终点根据距离不断相减判断的,那么起点就是 ...

    7. scrapy框架初识

      一.scrapy简介 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍.所谓的框架就是一个已经被集成了各种功能(高性能异步下载,队列,分布式,解析,持久化等)的具 ...

    8. my32_ error 1872 Slave failed to initialize relay log info structure from the repository

      重启了实例后,slave进程无法开启 Last_SQL_Errno: Last_SQL_Error: Slave failed to initialize relay log info structu ...

    9. Python+Selenium之通过batch跑脚本

      例如在执行路径C:\Portal_Scripts\Scripts下的脚本CreateIndicativeBOP.py,可以在notepad里面编写如下: @echo off cd  C:\Portal ...

    10. (转)图解SSH原理

      图解SSH原理 原文:https://www.jianshu.com/p/33461b619d53 http://blog.51cto.com/forlinux/1352900---------SSH ...