1、安装jdk,配置环境变量

root@localhost java]# vi /etc/profile

在profile中添加如下内容:

#set java environment
export  JAVA_HOME=/usr/java/jdk1.7.0_79
export  JRE_HOME=$JAVA_HOME/jre
export  CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
export  PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
export JAVA_HOME JRE_HOME CLASS_PATH PATH

搭建步骤指南:

http://blog.csdn.net/ab198604/article/details/8250461

http://www.powerxing.com/install-hadoop/

https://www.cnblogs.com/DreamDriver/p/6597020.html

2、新建hadoop 用户,赋给管理员权限

$sudo useradd -m hadoop -s /bin/bash

sudo passwd hadoop

sudo adduser hadoop sudo

3、配置单机hadoop环境

  1. 进入hadoop 安装目录,输入在本地机器(192.168.211.128)上使用ssh-keygen产生公钥私钥对

    $ ssh-keygen -t rsa

  1. 用ssh-copy-id将公钥复制到远程机器中 

    ssh-copy-id hadoop@192.168.211.129 ( 复制到远程服务器 salve1 )  ## 输入远程服务器的密码,最后一次输入密码,复制成功之后,就再不用输入密码了

4、手动下载hadoop安装包,本人下载的是 hadoop-2.6.5.tar.gz 包,解压包

  hadoop@ubuntu-virtual-machine:~$ ls
  hadoop-2.6.5 hadoop-2.6.5.tar.gz
  hadoop@ubuntu-virtual-machine:~$ tar zxvf hadoop-2.6.5.tar.gz

5、修改hadoop中的配置文件:

  • hadoop 目录 etc文件夹下的 hadoop-env.sh,增加  export JAVA_HOME=/usr/java/jdk1.8.0_152)
  • etc文件夹下的core-site.xml文件用文本编辑器打开,添加如下语句
    <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:9000</value>
    </property>

    这是hadoop核心的配置文件,这里配置的是HDFS的地址和端口号。

  • etc文件夹下的hdfs-site.xml文件用文本编辑器打开,添加如下语句
    <property>
         <name>dfs.replication</name>
         <value>1</value>
      </property>

    这是Hadoop中的HDFS的配置,配置的备份方式默认为3,在单机版的Hadoop中,需要将其改为1.

  • etc文件夹下的mapred-site.xml文件用文本编辑器打开,添加如下语句

    <property>

          <name>mapred.job.tracker</name>
          <value>localhost:9001</value>
       </property>
    这是Hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端口。
  • 在 sbin目录下打开 hadoop-env.sh  yarn-env.sh中添加  export JAVA_HOME=/usr/java/jdk1.8.0_152

6、在初次安装和使用Hadoop之前,需要格式化分布式文件系统HDFS。使用如下命令:

  # bin/hadoop namenode -format

7、启动Hadoop守护进程,命令如下

# bin/start-all.sh
 
在本地浏览器,输入地址进行验证
http://192.168.211.128:50070/
http://192.168.211.128:8088/

Hadoop 搭建集群的步骤的更多相关文章

  1. redis 一二事 - 搭建集群缓存服务器

    在如今并发的环境下,对大数据量的查询采用缓存是最好不过的了,本文使用redis搭建集群 (个人喜欢redis,对memcache不感冒) redis是3.0后增加的集群功能,非常强大 集群中应该至少有 ...

  2. 基于Hadoop分布式集群YARN模式下的TensorFlowOnSpark平台搭建

    1. 介绍 在过去几年中,神经网络已经有了很壮观的进展,现在他们几乎已经是图像识别和自动翻译领域中最强者[1].为了从海量数据中获得洞察力,需要部署分布式深度学习.现有的DL框架通常需要为深度学习设置 ...

  3. Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04

    前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...

  4. Hadoop分布式集群搭建

    layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...

  5. hadoop分布式集群的搭建

    电脑如果是8G内存或者以下建议搭建3节点集群,如果是搭建5节点集群就要增加内存条了.当然实际开发中不会用虚拟机做,一些小公司刚刚起步的时候会采用云服务,因为开始数据量不大. 但随着数据量的增大才会考虑 ...

  6. hadoop+spark集群搭建入门

    忽略元数据末尾 回到原数据开始处 Hadoop+spark集群搭建 说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...

  7. hadoop ha集群搭建

    集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...

  8. 使用docker搭建hadoop分布式集群

    使用docker搭建部署hadoop分布式集群 在网上找了非常长时间都没有找到使用docker搭建hadoop分布式集群的文档,没办法,仅仅能自己写一个了. 一:环境准备: 1:首先要有一个Cento ...

  9. hadoop+zookeeper集群高可用搭建

                                                                  hadoop+zookeeper集群高可用搭建 Senerity 发布于 2 ...

随机推荐

  1. python实现单线程多任务非阻塞TCP服务端

    代码 # coding:utf- from socket import * # .创建服务器socket sock = socket(AF_INET, SOCK_STREAM) # .绑定主机和端口 ...

  2. My Team——面向对象与软件工程实验三

    My Team 一.Name GDTX(团队成员姓氏的拼音首字母组成) 二.项目描述 微信小程序(小洁便签): 1,功能齐全:小洁便签具有大多数便签APP所具有的添加.查看.修改和删除便签内容以及插入 ...

  3. 关于分布式版本控制系统Git与集中式版本控制系统SVN的区别

    我觉得最最主要的区别就是:分布式Git主要是在本地有各个历史版本,在不联网的时候,也可以更新到最新版本和查看过去的版本,而集中式SVN是所有人都将版本上传到中央服务器,当出现断网情况的时候,用户只有一 ...

  4. Lucene配置环境变量

    更详细的内容请参考:http://www.cnblogs.com/itcsl/p/6804954.html 以下是参照上面的操作方式来说明的,首先下载lucene-6.2.1.zip文件,这个网上有的 ...

  5. docker 容器的mysql主从复制

    一. 1.首先拉取docker镜像,我们这里使用5.7版本的mysql:   docker pull mysql:5.7 2.分别启动主从两个容器: docker run -p 3339:3306 - ...

  6. SQL基本介绍

    SQL学习资料来源:http://www.w3school.com.cn/sql/index.asp SQL 是用于访问和处理数据库的标准的计算机语言. 什么是 SQL?SQL 指结构化查询语言SQL ...

  7. day 02 python 基础

    1.day1作业讲解 题目答案见day1 2.格式化输出 %占位符,s:字符串,d:数字 %%只是单纯的显示%(显示的%是后面的) #格式化输出 # % s d # name = input('请输入 ...

  8. js 如何判断数组元素是否存在重复项

    1.如何判断数组元素是否存在重复项 1)定义测试数组 //定义测试的数组(1个没有重复元素,1个有重复元素) var arr1 = new Array("111","33 ...

  9. js for in循环遍历对象,获取key:value值

    var testObj = { 'a':'111', 'b':'222', 'c':'333', 'd':'444'}for(var i in testObj){ console.log(i); // ...

  10. Go-ethereum源码解析-Part I

    1. 整体概览 makefile CANDY: .PHONY: geth android ios geth-cross swarm evm all test clean 已知phony 目标并非是由其 ...