1、 Build Linux env

my env is VM RedHat Linux 6.5 64bit
    set fixed IP    
              vim /etc/sysconfig/network-scripts/ifcfg-eth0

set IP to : 192.168.38.128

modify hostname: vim /etc/hosts

set hostname to :  itbuilder1

2、install JDK

config JDK env variables

3、install Hadoop env

download Apache hadoop pkg

addr:http://archive.apache.org/dist/hadoop/core/stable2/hadoop-2.7.1.tar.gz

3.1  Extract the package to the specified directory

create a dir : mkdir /usr/local/hadoop

extract file to dir : /usr/local/hadoop :tar -zxvf hadoop-2.7.1.tar.gz -C /usr/local/hadoop

3.2 Modify the configuration file

hadoop2.7.1 version need to modify 5 config files :

1、hadoop-env.sh

2、core-site.xml

3、hdfs-site.xml

4、mapred-site.xml(mapred-site.xml.template)

5、yarn-site.xml

these file all under etc of hadoop, the detail dir is : /usr/local/hadoop/hadoop-2.7.1/etc/hadoop/

3.2.1 Modfiy env variable (hadoop-env.sh)

vim hadoop-env.sh

set up JDK root directory, as shown below:

export JAVA_HOME=/usr/java/jdk1.8.0_20

3.2.2  core-site.xml ,set namenode and temp file addr of HDFS.

<configuration>
        <!--set HDFS addr (NameNode) -->
            <property> 
                    <name>fs.defaultFS</name>
                    <value>hdfs://itbuilder1:9000</value>
            </property>
        <!--set dir of Hadoop runtime file storage directory-->
            <property> 
                    <name>hadoop.tmp.dir</name>
                    <value>/usr/local/hadoop/hadoop-2.7.1/tmp</value>
            </property> 
      </configuration>

3.2.3 hdfs-site.xml (set duplicate quantity)

<configuration>
          <property> 
                <name>dfs.replication</name>
                <value>1</value>
            </property>
        </configuration>

3.2.4 mapred-site.xml  ( tell hadoop that later MR runs on yarn )

<configuration>
                <property>
                      <name>mapreduce.framework.name</name>
                        <value>yarn</value>
                  </property>
            </configuration>

3.2.5 yarn-site.xml

<configuration>
                  <!-- tell nodemanager the way to get data is shuffle -->
                  <property> 
                              <name>yarn.nodemanager.aux-services</name>
                                <value>mapreduce_shuffle</value>
                    </property>

<!--set yarn addr (ResourceManager) -->
                    <property>
                              <name>yarn.resourcemanager.hostname</name>
                                <value>itbuilder1</value>
                    </property>

</configuration>

4、add hadoop to env variable

vim /etc/profile

export JAVA_HOME=/usr/java/jdk1.8.0_20
export HADOOP_HOME=/usr/local/hadoop/hadoop-2.7.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

#refresh /etc/profile
 source /etc/profile

5、Initialize (format) file system (HDFS)
    #hadoop namenode -format 
    hdfs namenode -format

6、start hadoop (hdfs yarn)
./start-all.sh (need to input linux password)
./start-hdfs.sh
./start-yarn.sh

View the current process of opening by JPs command

[root@linuxidc ~]# jps
3461 ResourceManager
3142 DataNode
3751 NodeManager
3016 NameNode
5034 Jps
3307 SecondaryNameNode

Access the management interface :
http://192.168.38.128:50070 (hdfs management interface)
http://192.168.38.128:8088 (mr management interface)

Linux_hadoop_install的更多相关文章

随机推荐

  1. Censored! - POJ 1625(ac自动机+简单dp+高精度运算)

    题目大意:首先给一个字符集合,这个集合有N个字符,然后需要一个长度为M的句子,但是据子里面不能包含的串有P个,每个串里面的字符都是有字符集和里面的字符构成的,现在想知道最多能构造多少个不重复的句子. ...

  2. js中正则表达式的使用

    1,作用:匹配一个字符串中的一些内容2,声明和使用: 1),构造函数 var reg=new RegExp(/表达式/) 2),字面量 var reg=/表达式/ 推荐使用 eg: var reg=/ ...

  3. Java NIO框架Netty demo

    Netty是什么 Netty是一个java开源框架.Netty提供异步的.事件驱动的网络应用程序框架和工具,用以快速开发高性能.高可靠性的网络服务器和客户端程序. 也就是说,Netty 是一个基于NI ...

  4. geektool--一款很geek的工具

    2016/12/18 今天尝试一款很geek的工具 geektool 听名字就超级geek有木有 get it geektool website 从官网直接下载app,一键傻瓜式安装. use it ...

  5. Shiro Quartz之Junit測试Session管理

    Shiro的quartz主要API上提供了org.apache.shiro.session.mgt.quartz下session管理的两个类:QuartzSessionValidationJob和Qu ...

  6. sdaf

  7. TCP/IP协议原理与应用笔记07:HTTP、TCP/IP与socket区别

    1. TCP/IP协议与HTTP协议区别:      HTTP 超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议.所有的WWW文件 ...

  8. ansible小结

    一.Ansible的安装 1.yum源安装 以centos为例,默认在源里没有ansible,不过在fedora epel源里有ansible,配置完epel 源后,可以直接通过yum 进行安装.这里 ...

  9. lvs+heartbeat搭建负载均衡高可用集群

    [172.25.48.1]vm1.example.com [172.25.48.4]vm4.example.com 集群依赖软件:

  10. NYOJ-520 最大素因子

    这个题基本上就两个知识点, 一个素数筛选法求素数,另一个是求最大公因子, 不过确定最大素数在素数表中的位置时,要用到二分的思想,不然会超时,下面是具体代码的实现; #include <stdio ...