1、安装jdk,配置环境变量

root@localhost java]# vi /etc/profile

在profile中添加如下内容:

#set java environment
export  JAVA_HOME=/usr/java/jdk1.7.0_79
export  JRE_HOME=$JAVA_HOME/jre
export  CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
export  PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
export JAVA_HOME JRE_HOME CLASS_PATH PATH

搭建步骤指南:

http://blog.csdn.net/ab198604/article/details/8250461

http://www.powerxing.com/install-hadoop/

https://www.cnblogs.com/DreamDriver/p/6597020.html

2、新建hadoop 用户,赋给管理员权限

$sudo useradd -m hadoop -s /bin/bash

sudo passwd hadoop

sudo adduser hadoop sudo

3、配置单机hadoop环境

  1. 进入hadoop 安装目录,输入在本地机器(192.168.211.128)上使用ssh-keygen产生公钥私钥对

    $ ssh-keygen -t rsa

  1. 用ssh-copy-id将公钥复制到远程机器中 

    ssh-copy-id hadoop@192.168.211.129 ( 复制到远程服务器 salve1 )  ## 输入远程服务器的密码,最后一次输入密码,复制成功之后,就再不用输入密码了

4、手动下载hadoop安装包,本人下载的是 hadoop-2.6.5.tar.gz 包,解压包

  hadoop@ubuntu-virtual-machine:~$ ls
  hadoop-2.6.5 hadoop-2.6.5.tar.gz
  hadoop@ubuntu-virtual-machine:~$ tar zxvf hadoop-2.6.5.tar.gz

5、修改hadoop中的配置文件:

  • hadoop 目录 etc文件夹下的 hadoop-env.sh,增加  export JAVA_HOME=/usr/java/jdk1.8.0_152)
  • etc文件夹下的core-site.xml文件用文本编辑器打开,添加如下语句
    <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:9000</value>
    </property>

    这是hadoop核心的配置文件,这里配置的是HDFS的地址和端口号。

  • etc文件夹下的hdfs-site.xml文件用文本编辑器打开,添加如下语句
    <property>
         <name>dfs.replication</name>
         <value>1</value>
      </property>

    这是Hadoop中的HDFS的配置,配置的备份方式默认为3,在单机版的Hadoop中,需要将其改为1.

  • etc文件夹下的mapred-site.xml文件用文本编辑器打开,添加如下语句

    <property>

          <name>mapred.job.tracker</name>
          <value>localhost:9001</value>
       </property>
    这是Hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端口。
  • 在 sbin目录下打开 hadoop-env.sh  yarn-env.sh中添加  export JAVA_HOME=/usr/java/jdk1.8.0_152

6、在初次安装和使用Hadoop之前,需要格式化分布式文件系统HDFS。使用如下命令:

  # bin/hadoop namenode -format

7、启动Hadoop守护进程,命令如下

# bin/start-all.sh
 
在本地浏览器,输入地址进行验证
http://192.168.211.128:50070/
http://192.168.211.128:8088/

Hadoop 搭建集群的步骤的更多相关文章

  1. redis 一二事 - 搭建集群缓存服务器

    在如今并发的环境下,对大数据量的查询采用缓存是最好不过的了,本文使用redis搭建集群 (个人喜欢redis,对memcache不感冒) redis是3.0后增加的集群功能,非常强大 集群中应该至少有 ...

  2. 基于Hadoop分布式集群YARN模式下的TensorFlowOnSpark平台搭建

    1. 介绍 在过去几年中,神经网络已经有了很壮观的进展,现在他们几乎已经是图像识别和自动翻译领域中最强者[1].为了从海量数据中获得洞察力,需要部署分布式深度学习.现有的DL框架通常需要为深度学习设置 ...

  3. Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04

    前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...

  4. Hadoop分布式集群搭建

    layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...

  5. hadoop分布式集群的搭建

    电脑如果是8G内存或者以下建议搭建3节点集群,如果是搭建5节点集群就要增加内存条了.当然实际开发中不会用虚拟机做,一些小公司刚刚起步的时候会采用云服务,因为开始数据量不大. 但随着数据量的增大才会考虑 ...

  6. hadoop+spark集群搭建入门

    忽略元数据末尾 回到原数据开始处 Hadoop+spark集群搭建 说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...

  7. hadoop ha集群搭建

    集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...

  8. 使用docker搭建hadoop分布式集群

    使用docker搭建部署hadoop分布式集群 在网上找了非常长时间都没有找到使用docker搭建hadoop分布式集群的文档,没办法,仅仅能自己写一个了. 一:环境准备: 1:首先要有一个Cento ...

  9. hadoop+zookeeper集群高可用搭建

                                                                  hadoop+zookeeper集群高可用搭建 Senerity 发布于 2 ...

随机推荐

  1. hive参数配置详细

    hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行) true hive.exec.mode.local.auto.i ...

  2. 如何利用redis来进行分布式集群系统的限流设计

    在很多高并发请求的情况下,我们经常需要对系统进行限流,而且需要对应用集群进行全局的限流,那么我们如何类实现呢. 我们可以利用redis的缓存来进行实现,并且结合mysql数据库一起,先来看一个流程图. ...

  3. JavaScrpt常用的封装方法

    1.闭包封装.在这个封装方法中,所有的实例成员都共享属性和方法, 使得所有得方法和属性都私有且对象间共享 (function ($) { var Person = function(name) { r ...

  4. git同时存在两个账号(在同一台电脑上)——三步完成

    目录 1.首先是常规设置 2.同时添加两个账号 3.最后一步,配置~/.ssh/config文件 4.补充:有时因为设置了全局账号,因此需要清除 由于本人有连个git账号,个人github账号和公司g ...

  5. Linux之redis-cluster(集群配置)

    redis-cluster配置   为什么要用redis-cluster 1.并发问题 redis官方声称可以达到 10万/每秒,每秒执行10万条命令假如业务需要每秒100万的命令执行呢? 2.数据量 ...

  6. QMessageBox对话框

    infoBox = QMessageBox() infoBox.setIcon(QMessageBox.Question) infoBox.setWindowTitle("初始化失败&quo ...

  7. JUC原子类--01

    JUC原子操作类分为四种类型 1. 基本类型: AtomicInteger, AtomicLong, AtomicBoolean ;2. 数组类型: AtomicIntegerArray, Atomi ...

  8. git reset 和 git revert 使用区别

    git reset 用于回退代码,但是git pull后会和远程分支保持一致,所以无法修改远程代码 git revert可以撤销代码,撤销后直接git push ,可以修改远程分支的代码

  9. 自己常用vs code 插件

    subline   快捷键配置插件 Auto Close Tag — 自动闭合HTML标签 Auto Rename Tag — 修改HTML标签时,自动修改匹配的标签 background — 背景 ...

  10. 文科生打开python的大门

    作为唯一的一名教育学院的学生,加入python课程,一定要声明我可不是并不是被迫选课的!虽然是文科生,但是是对编程这种东西很感兴趣的文科生.从站在python门口的张望,到现在悄悄把门打开,越来越感觉 ...