【0】安装前的声明

0.1）所用节点2个

master : 192.168.119.105 hadoop5

slave : 192.168.119.101 hadoop1

（先用一个slave，跑成功后，在从master分别scp到各个slaves即可】）

0.2）每个机子的那些个文件需要一样

（或者直接从master直接scp到各个slaves即可）

vim /etc/hosts（主机名和ip地址映射文件）

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.119.101 hadoop1

192.168.119.102 hadoop2

192.168.119.103 hadoop3

192.168.119.104 hadoop4

192.168.119.105 hadoop5

jdk 解压目录

这里统一解压到 /usr/java/jdk

0.3）所有master和slaves机子的用户名全部是hadoop

注意要用hadoop用户的权限对hadoop的文件配置进行操作

【1】安装JDK

1.1）解开jdk压缩包

tar -zvx -f jdk-7u7-linux-x64.tar.gz （解压缩，-z处理gz, -j 处理 bzip2）

（或许之前，你需要 chmod 755 your_jdk_file）

1.2）配置环境变量

打开/etc/profile，在文件最后输入下面内容

1.3） source /etc/profile

作用:在当前bash环境下读取并执行FileName中的命令。

注：该命令通常用命令“.”来替代。

如：source .bash_rc 与 . .bash_rc 是等效的。

注意：source命令与shell scripts的区别是，

source在当前bash环境下执行命令，而scripts是启动一个子shell来执行命令。这样如果把设置环境变量（或alias等等）的命令写进scripts中，就只会影响子shell,无法改变当前的BASH,所以通过文件（命令列）设置环境变量时，要用source 命令。

1.4 )设置新安装的JDK为默认的JDK

命令行输入如下命令：

sudo update-alternatives –install /usr/bin/java java /usr/java/jdk/bin/java 300

sudo update-alternatives –install /usr/bin/javac javac /usr/java/jdk/bin/javac 300

sudo update-alternatives –config java

（Attention）–install 和 –config 是两个横线-，

1.5）验证Java是否安装成功

　输入 java-version ，输出Java版本信息即为安装成功。

【2】SSH 安装

（google ssh centos 安装

http://www.cnblogs.com/alaska1131/articles/1659654.html）

（以下配图中的文字有错误，改为：

ssh的公私钥建立输入命令：ｓｓｈ－ｋｅｙｇｅｎ　就可以了（其默认的密钥生成方式是ｒｓａ）　，　

然后三个回车，默认的公私钥就在家目录的.ssh文件夹下了。）

2.1）如何使用ssh

ssh的目的就是使用免密码登陆；

如果在master上，如

Attention）

A1 ) 当ssh安装后，.ssh 文件夹会自动生成在家目录（如/home/hadoop下），所有机器的.ssh 的访问权限必须是700

A2）在.ssh 下的authorized_keys 的权限必须是644或者600,

A3）ssh会依据.ssh和authorized_keys的权限来判断是否接受免密码登陆

【3】Hadoop2.6.0 配置

http://blog.csdn.net/caiandyong/article/details/42815221

http://blog.csdn.net/caiandyong/article/details/44925845

3.1）文件配置（hadoop解压文件所放置的目录，请自行创建）

以下配置文件只需傻瓜式的copy and paste



vim core-site.xml

<configuration>

        <property>

                <name>fs.defaultFS</name>

                <value>hdfs://hadoop5:9000</value>

                <description>A base for other temporary directories.</description>

        </property>

        <property>

                <name>io.file.buffer.size</name>

                <value>4096</value>

        </property>

        <property>

                <name>hadoop.tmp.dir</name>

                <value>file:/home/hadoop/hdfs/hadooptmp</value>

        </property>

        <property>

                 <name>hadoop.proxyuser.spark.hosts</name>

                 <value>*</value>

        </property>

        <property>

                <name>hadoop.proxyuser.spark.groups</name>

                <value>*</value>

        </property>

</configuration>

vim hdfs-site.xml

<configuration>

         <property>

                 <name>dfs.namenode.secondary.http-address</name>

                 <value>hadoop5:9001</value>

         </property>

        <property>

                <name>dfs.namenode.name.dir</name>

                <value>/home/hadoop/hdfs/namenode</value>

        </property>

         <property>

                 <name>dfs.datanode.data.dir</name>

                 <value>/home/hadoop/hdfs/datanode</value>

         </property>

        <property>

                <name>dfs.replication</name>

                <value>1</value>

        </property>

         <property>

                 <name>dfs.webhdfs.enabled</name>

                 <value>true</value>

         </property>

</configuration>

vim mapred-site.xml

<configuration>

        <property>

                <name>mapreduce.framework.name</name>

                 <value>yarn</value>

        </property>

        <property>

                <name>mapreduce.jobhistory.address</name>

                <value>hadoop5:10020</value>

         </property>

          <property>

                 <name>mapreduce.jobhistory.webapp.address</name>

                 <value>hadoop5:19888</value>

          </property>

</configuration>

vim yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

        <property>

                <name>yarn.resourcemanager.hostname</name>

                <value>hadoop5</value>

        </property>

    <property>

            <name>yarn.nodemanager.aux-services</name>

            <value>mapreduce_shuffle</value>

    </property>

    <property>

            <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

            <value>org.apache.hadoop.mapred.ShuffleHandler</value>

    </property>

    <property>

            <name>yarn.resourcemanager.address</name>

            <value>hadoop5:8032</value>

    </property>

    <property>

            <name>yarn.resourcemanager.scheduler.address</name>

            <value>hadoop5:8030</value>

    </property>

    <property>

            <name>yarn.resourcemanager.resource-tracker.address</name>

            <value>hadoop5:8031</value>

    </property>

    <property>

            <name>yarn.resourcemanager.admin.address</name>

           <value>hadoop5:8033</value>

    </property>

    <property>

            <name>yarn.resourcemanager.webapp.address</name>

            <value>hadoop5:8088</value>

    </property>

</configuration>

vim slaves （有多少个slaves 就写对应的主机名）

hadoop1

hadoop2 （若从master scp到slaves(hadoop2的话)）

vim hadoop-env.sh 末尾追加

export JAVA_HOME=/usr/java/jdk

export HADOOP_PREFIX=/home/hadoop/hadoop

【Complementary】

从master（hadoop5） scp hadoop framework到 slave（hadoop2）

1) jump到hadoop5的家目录

2) scp -r hadoop/ hadoop@hadoop2:~/

3) scp -r /usr/java/jdk/ hadoop@hadoop2:~ ；

and then

sudo cp -r ~/jdk /usr/java/；

You Should Know: (when execute scp operation from master to slave)

1) 修改 hadoop/etc/hadoop/slaves 添加hadoop2 这是slave的主机

2) 修改hadoop/etc/hadoop/hdfs-site.xml 将 dfs.replication 修改为2

3.2）格式化hdfs （slave端不需要此operation）

bin/hdfs namenode -format

3.3）开启所有进程（slave端不需要此operation）

sbin/start-all.sh

or 关闭所有进程 sbin/stop-all.sh

3.4) 访问

hdfs的 web页面 http://192.168.119.101:50070/dfshealth.html#tab-overview

hadoop 的节点 web页面 http://192.168.119.101:8088/cluster/nodes

【Attention】

如果要重新格式化，请吧hdfs的文件夹 namenode,datanode and hadooptmp 文件夹里面的内容清空干净

rm -r * ，然后在重新格式化，启动所有进程，等等。

3.5）最后的效果（缺一不可）

如果scp master（hadoop5）上面的hadoop framwork 到 slave2（hadoop2）上的话，

那么你会看到：

至此，hadoop集群搭建完毕。

3.6）两个节点的集群启动（补充）

首先，我们用到了一个master（hadoop5）和一个slave（hadoop1），后来，我们又添加了一个slave（hadoop2），我们看看两个节点的启动效果。

Bingo !

【4】CentOS上安装eclipse IDE工具（只为方便调试java程序） + hadoop 集成

4.1）下载eclipse 官网

并传送到centos上，推荐使用 lrzsz 这个工具（centos 上安装）

lrzsz 使用实例

安装lrzsz （receive 和 send）

yum install lrzsz

rz r就是receive linux服务器接收。也就是 windows上传文件。

如图，输入rz会调出一个对话框，可以选择你需要上传的文件

sz r就是Send linux服务器发送。也就是 windows下载文件。

如图，输入sz 后面接上你需要发送的文件或文件夹。

4.2）解压即可，放置到/usr/local/

4.3）下载插件 hadoop-eclipse-plugin-2.6.0.jar

并放置到 /usr/local/eclipse/plugins

4.4）配置eclipse 和 MapReduce IDE

创建项目完成，接下来，你就开始coding吧。

hadoop2.6.0+eclipse配置的更多相关文章

搭建Hadoop2.6.0+Eclipse开发调试环境(以及log4j.properties的配置)
上一篇在win7虚拟机下搭建了hadoop2.6.0伪分布式环境.为了开发调试方便,本文介绍在eclipse下搭建开发环境,连接和提交任务到hadoop集群. 1. 环境 Eclipse版本Luna ...
hadoop2.4.0 安装配置 (2)
hdfs-site.xml 配置如下: <?xml version="1.0" encoding="UTF-8"?> <?xml-styles ...
HDP2.0.6+hadoop2.2.0+eclipse（windows和linux下）调试环境搭建
花了好几天,搭建好windows和linux下连接HDP集群的调试环境,在此记录一下 hadoop2.2.0的版本比hadoop0.x和hadoop1.x结构变化很大,没有eclipse-hadoop ...
Ubuntu14.04下hadoop-2.6.0单机配置和伪分布式配置
需要重新编译的教程:http://blog.csdn.net/ggz631047367/article/details/42460589 在Ubuntu下创建hadoop用户组和用户 hadoop的管 ...
搭建Hadoop2.6.0+Eclipse开发调试环境
上一篇在win7虚拟机下搭建了hadoop2.6.0伪分布式环境.为了开发调试方便,本文介绍在eclipse下搭建开发环境,连接和提交任务到hadoop集群. 1. 环境 Eclipse版本Luna ...
HADOOP2.2.0安装配置指南
一. 集群环境搭建这里我们搭建一个由三台机器组成的集群: Ip地址用户名/密码主机名集群中角色操作系统版本 192.168.0.1 hadoop/hadoop Hadoop-mast ...
Hadoop2.2.0安装配置手册！完全分布式Hadoop集群搭建过程~（心血之作啊~~）
http://blog.csdn.net/licongcong_0224/article/details/12972889 历时一周多,终于搭建好最新版本hadoop2.2集群,期间遇到各种问题,作为 ...
Hadoop2.2.0安装配置手册
第一部分 Hadoop 2.2 下载 Hadoop我们从Apache官方网站直接下载最新版本Hadoop2.2.官方目前是提供了linux32位系统可执行文件,所以如果需要在64位系统上部署则需要单独 ...
hadoop-2.2.0 HA配置
采用的是4台真实机器: namenode:qzhong node27 datanode:qzhong node27 node100 node101 操作系统环境:qzhong(Ubuntu-14.0 ...

随机推荐

粗解Xcode 5新特性： Asset Catalogs
原文:http://schlu.org/2013/10/01/Xcode-Asset-Catalogs.html 基础知识在今年的WWDC大会上苹果介绍了Asset Catalogs.Asset C ...
Win8制作和使用恢复盘
制作和使用恢复盘要制作恢复盘,请执行以下操作:注:确保计算机连接到交流电源.1. 将指针移至屏幕的右上角或右下角以显示超级按钮,然后单击搜索.2. 根据操作系统的不同,执行以下某项操作:• 在 Win ...
mac 安装PIL
PIL是python Image library 在mac终端中通过以下命令安装: # download curl -O -L http://effbot.org/media/downloads/Im ...
android: Incorrect line ending: found carriage return (\r) without corresponding newline (\n)
当报这种错误的时候:Incorrect line ending: found carriage return (\r) without corresponding newline (\n) 解决方法: ...
jdk各个班本官网下载地址
http://www.oracle.com/technetwork/java/archive-139210.html
（2）html文本格式化解说
10分钟学会基于ASP.NET的 JQuery实例 (转)
本文介绍如何在ASP.NET(ASP.NET/AJAX)里使用基于JQuery的AJAX技术.(源代码下载见最后) 在使用JQuery前,请到www.jquery.com下载最新版本的js代码,然后再 ...
SGU 538. Emoticons 水题
538. Emoticons 题目连接: http://acm.sgu.ru/problem.php?contest=0&problem=538 Description A berland n ...
[Ember] Ember.js Templates
In this lesson, we'll go over some of the basics of Ember.js templates and how they work with contro ...
Golang学习 - bufio 包
------------------------------------------------------------ // bufio 包实现了带缓存的 I/O 操作 -------------- ...

hadoop2.6.0+eclipse配置